AI is open source - Page 5 - AI tool navigation

AI information AI Encyclopedia AI recommendation AI compliance AI is open source AI prompts AI News Briefing AI Q&A AI hardware

LongCat-Next Open Source Release: A native multimodal model that unifies text, image, and audio

- Abstract LongCat-Next is an open-sourced discrete native autoregressive multimodal model from Meituan's LongCat team, with the goal of unifying text...

Admin • 3/26/2026

129

HY3D-Bench Open Source Interpretation: 252K high-quality 3D asset dataset and unified evaluation system

1. Abstract HY3D-Bench is an open-sourced unified 3D asset data ecosystem by Tencent's Hunyuan team, with the goal of alleviating the common pain poin...

Admin • 2/7/2026

163

Qwen3-Coder-Next Comprehensive Interpretation: 80B/3B Ultra-Sparse Open Source Weight Model for Coding Agents

1. Abstract Qwen3-Coder-Next is an open-source weighted code model released by Qwen Team, which is suitable for coding agents and local development sc...

Admin • 2/4/2026

266

Youtu-VL-4B-Instruct Open Source Interpretation: Using VLUAS to Make 4B Visual Perception "Like Model Native Capabilities"

1. Abstract Youtu-VL-4B-Instruct is a compact visual language model (4B parameters) open source by Tencent Youtu, which proposes VLUAS (Vision-Languag...

Admin • 1/31/2026

150

PaddleOCR-VL-1.5 Open Source Interpretation: How the 0.9B Multimodal Model Overcomes Bending and Distorting Documents

1. Abstract PaddleOCR-VL-1.5 is an open-source 0.9B parametric document multimodal model of PaddlePaddlePaddle, which provides integrated capabilities...

Admin • 1/31/2026

159

PaddleOCR Comprehensive Understanding: From Multilingual OCR to PDF Parsing and Structured Output (Markdown/JSON)

1. Abstract PaddleOCR is an open-source OCR and document parsing toolbox based on PaddlePaddle, which provides "text recognition + structured extracti...

Admin • 1/29/2026

364

LongCat-Next Open Source Release: A native multimodal model that unifies text, image, and audio

HY3D-Bench Open Source Interpretation: 252K high-quality 3D asset dataset and unified evaluation system

Qwen3-Coder-Next Comprehensive Interpretation: 80B/3B Ultra-Sparse Open Source Weight Model for Coding Agents

Youtu-VL-4B-Instruct Open Source Interpretation: Using VLUAS to Make 4B Visual Perception "Like Model Native Capabilities"

PaddleOCR-VL-1.5 Open Source Interpretation: How the 0.9B Multimodal Model Overcomes Bending and Distorting Documents

PaddleOCR Comprehensive Understanding: From Multilingual OCR to PDF Parsing and Structured Output (Markdown/JSON)

Recommended Tools

Submit AI Tool

Please confirm submission information