大语言模型比较---以Fracman为例

11月前浏览7148

摘要

本文介绍了Open-WebUI的升级过程，涉及下载最新代码、停止和删除旧容器、以及使用新映像创建新容器。同时，列出了当前安装的多个大语言模型，包括它们的大小和适用情况。在模型比较部分，通过特定测试任务“Using fracman to understand wedge failures for open pit slope design”对各模型进行了评估，结果显示Llama3和Llama3:70b-instruct模型在提供详细和合理回答方面表现较好，但Command-R-Plus模型虽准确但运行时间较长，而其他模型在识别特定术语或提供有用信息方面存在不足。

正文

1. 引言

Open-WebUI【Open-webui---构建基于本地知识库的大语言模型框架】是本地最主要的LLM框架，由于docker下的代码升级与Windows程序的升级方式不同，因此记录下这个过程，便于以后再次升级使用。

2. 升级Open-WebUI

(1) 下载最新代码

docker pull ghcr.io/open-webui/open-webui:main

(2) 停止和删除存在的容器，此步骤可确保能用更新后的映像创建新容器。

docker stop open-webuidocker rm open-webui

(3) 使用更新后的映像创建新容器，使用与创建容器时相同的 docker run 命令，确保所有配置保持不变。

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

上述过程会将 Open WebUI 容器更新为最新版本，同时保留存储在 Docker 卷中的数据。

3. 目前安装的模型

目前已经安装了以下模型：

(1) command-r:latest (20 GB)

(2) command-r-plus:latest (59 GB)

(3) dolphin-llama3:latest (4.7 GB)

(4) gemma:latest (5.0 GB)

(5) llama2:latest (3.8 GB)

(6) llama3:70b-instruct (39 GB)

(7) llama3:latest (4.7 GB)

(8) mistral:latest (4.1 GB)

(9) mxbai-embed-large:latest (669 MB)

(10) nomic-embed-text:latest (274 MB)

(11) wizardlm2:latest (4.1 GB)

其中(2)和(6)的模型尺寸太大，目前的机器配置不能顺利使用这两个模型【2024年第16周 | 顺利运行大语言模型所需的内存】；(9)和(10)用于词嵌入。

4. 模型比较

在先前的测试中，各模型的比较结果从优到差依次为：

(1) Llama3【短期课程 | 集成的三维岩石边坡稳定性分析】

(2) Wizardlm2【Ollama 新增微软的 WizardLM 2模型 (V0.1.32)】

(3) Llama2【Ollama本地运行的实践---离散断裂网络DFN】

这一次，我们使用"Using fracman to understand wedge failures for open pit slope design"对上述模型进行测试。

[1] command-r:latest (20 GB)

这个模型不能正确地辨识出fracman是什么。

[2] command-r-plus:latest (59 GB)

这是迄今为止试验的最大尺寸的模型，给出了非常正确并且详细的解答，花费了18分钟运行完模型，因此在目前的机器配置下，这个模型虽好但不实用。

[3] dolphin-llama3:latest (4.7 GB)

这个模型作了简短的回答，基本上没有给出任何信息。

[4] gemma:latest (5.0 GB)

这个模型不能正确识别出fracman的确切含义。

[5] llama2:latest (3.8 GB)

这个模型正确地识别出fracman，并且给出了有意义的回答。

[6] llama3:70b-instruct (39 GB)

这个模型占用了大约49G内存，运行了大约7分钟，给出了非常详细并且合理的回答。

[7] llama3:latest (4.7 GB)

这个模型给出了快而准确的回答。

[8] mistral:latest (4.1 GB)

这个模型不能正确识别fracman，给出了一些导向错误的回答。

[9] wizardlm2:latest (4.1 GB)

这个模型也不能正确识别出fracman，因而给出了一些无意义的回答。

语义搜索 | 使用Fracman进行岩石楔分析
Fracman读取FLAC3D生成的离散断裂网络(DFN)模型
Fracman的岩土模块---主要功能和参考文献
FLAC3D导入Fracman生成的离散断裂网络(DFN)模型
露天矿边坡稳定性的离散断裂网络(DFN)分析

5. 结束语

本文把Open-WebUI升级到最新版本，记录了升级过程以便为以后参考。在此基础上通过一个例子比较了目前下载的大模型，结果显示最好的模型是llama3:latest，llama3:70b-instruct的运行时间较长，而command-r-plus:latest尽管也能给出满意的回答，但运行时间过长。

来源：计算岩土力学

断裂岩土 FLAC3D 试验

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2024-05-03

最近编辑：11月前

计算岩土力学

传播岩土工程教育理念、工程分析...

获赞 157粉丝 1174文章 1785课程 0

还没有评论

大语言模型比较---以Fracman为例

1. 引言

2. 升级Open-WebUI

3. 目前安装的模型

4. 模型比较

5. 结束语

有问必答第2期-无主题自由问答专场【直播回放】

LS-DYNA水下航行体出水破冰模拟（S-ALE方法）

金砖大赛工程仿真执行仲裁长赵敏专家：工业软件定义金砖工业未来

大学本科课程 现代通信系统概论（上）

ABAQUS钢纤维混凝土梁四点弯曲模拟

ANSYS显示动力学案例2弹丸冲击侵彻机场钢筋混凝土跑道的仿真材料本构模型混凝土钢筋耦合SPH粒子流

桂林理工大学刘文博副教授：穿越活断层隧洞断错致灾机理及防控技术研究

LS-DYNA的LEB法模拟混凝土多点延期空爆（load_blast_enhanced）

大学本科课程现代通信系统概论（上）