前阵子腾讯发布了一款名为ima的软件,主要功能是借助AI大模型实现搜索、文档知识库等功能。然而受限于混元大模型的能力水平,用起来没什么感觉。不过这两天,ima宣布接入了DeepSeek R1,这样一下子就解决了混元模型智商不足的难题。以前也曾试过利用大模型直接解析文档(如用通义或kimi),但如果文档内容非常大的话,解析效果会非常差。利用RAG制作知识库应该是一种处理大文档的不错的方式。
ima官网地址:https://ima.qq.com/。ima目前支持Mac、Windows以及小程序版本。
”
ima不止是一个大模型调用平台,更多的是可以将其用于知识库。而且可以利用大模型搜索微 信 公 众号内容,甚至可以将微 信公众 号文章当作知识库内容。因此,ima会是一个非常好的文献阅读平台。比如可以将一堆文献放在相同的知识库中,然后让ima基于该知识库进行总结。当然也可以将软件文档制作成知识库,在软件使用中遇到问题时可以直接基于知识库进行搜索,这会比直接搜索原始文档更有效率。
下面简单了解一下在ima中创建知识库的过程。
首先启动ima,然后点击左侧工具栏中的 知识库 按钮即可进入知识库页面。如下图所示,ima提供了两类知识库:个人知识库与共享知识库。其中个人知识库创建完毕后只能自己访问,而共享知识库则可以共享给其他人用。
选择自己想要创建的知识库类型,然后将想要充当知识库的文档拖拽到右侧的空白处即可,或者也可以点击右上角的文件浏览按钮打开文件选择对话框并选择文档。目前支持的文件类型为 PDF、DOC、DOCX、JPEG、PNG、JPG。很奇怪为什么不支持txt或md之类的文本类型。
imo提供了1G的知识库空间,似乎能放不少的文件。根据个人经验,上传的PDF文件似乎不能超过1000页,解析的时候会出错。文档上传后系统会自动对文档进行解析,处理效率极高。1000页的PDF文件大概一两分钟就能搞定。不知道用的是什么模型。
知识库创建完毕后即可基于知识库进行提问了,目前支持混元大模型及DeepSeek R1模型。简单的测试了一下,召回率还不错,比我在Obsidian中借助Copilot插件利用BGE-V3要好不少。
个人感受:如果把一堆文献丢进来作为知识库,然后从文献中提取信息,想想都不要太爽。
”
如果想要将知识库分享给其他人使用,也可有创建共享知识库。
点击下图所示的按钮可以添加共享知识库。与个人知识库一样,可以往里面拖拽文档。如下图所示,我将Fluent的所有文档放在一起,就构建成了一个Fluent知识库。在上传的时候将UserGuide分割成多个文件,每个文件在1000页以内。
共享知识库创建完毕后,可以通过右上角共享按钮将其共享给其他人,也可有将知识库设置为仅自己可见。
共享知识库创建完毕后,同样可以基于知识库进行问答。
看效果还不错。
建议:如果知识库由英文文档组成,建议用英文提示词进行询问,若知识库为中文文档,则建议用中文进行询问。
”