[功能]: 指定视觉模型为文本模型提供OCR能力 #612

mkraku · 2025-01-01T12:27:09Z

否

参考deepseek官网，他们应该是有一个专门的OCR模型，可以提取图片和扫描版的文档的文字作为上下文发起提问
想要在默认模型中增加一个“视觉模型”，为无视觉能力的AI提供图片和文档对话的可能。
硅基流动有便宜的视觉模型，智谱也有免费的视觉模型，用来做ocr足够了。

No response

No response

github-actions bot assigned kangfenmao Jan 1, 2025

Provide feedback