本文摘要(由AI生成):
这篇文档主要介绍了阿里通义千问的文档解析功能。作者对国内几款大模型的文档解析功能进行了测试,发现通义千问对文档的支持最好,不仅支持超大文件,还支持超长上下文解析。在对 FluentUDF 文档的测试中,通义千问的表现还不错,虽然存在一些瑕疵,但技术仍在发展中。作者表示下次会尝试读取更大的 UserGuide 文档。
今天来试试阿里通义千问的文档解析功能。
尝试一波后发现国内大模型中,通义千问对文档的支持是最好的。其不仅支持超大文件,还支持超长上下文解析。通义千问支持同时上传100个文件,单文件最大150 MB。就连最近吹得牛逼哄哄的Claude 3也做不到(Claude 3支持上传10个不大于10MB的文件)。国内最近广告颇多的kimi也只支持上传50个不大于100 MB的文件。至于智谱清言就更弱了,只支持上传10个不大于20 MB的文件。
当然,上传文件够多够大虽然是优势,但文档解析能力也不能忽视。否则光吃不消化也是浪费粮食。
这里拿Fluent UDF文档来尝一下。这个文档大小不到15 MB。
先上传文档,上传完毕后会自动解析文档。
文档解析完毕后,即可针对文档中的内容进行问答了。
先来个开胃的问题。
回答中规中矩,但回答的内容似乎超出了文档自身的范围。
再来个上点儿难度的。
再问点儿其他的。
总体表现还不错。虽然有一些瑕疵,但技术还在发展中。。。
下次试试读一波UserGuide,那个文档有170多MB,需要先分割一下。
(完)