精选FastChat(小羊驼模型)部署体验

kuokay

发布时间 2024.02.14阅读数 594 评论数 0

简介

前段时间，斯坦福发布了Alpaca，是由Meta的LLaMA 7B微调而来，仅用了52k数据，性能可以与GPT-3.5匹敌。

FastChat集成了Vicuna、Koala、alpaca、llama等开源模型，其中Vicuna号称能够达到gpt-4的90%的质量，是开源的chatGPT模型中对答效果比较好的。

现在UC伯克利学者联手CMU、斯坦福等，再次推出一个全新模型70亿/130亿参数的Vicuna，俗称「小羊驼」（骆马）。小羊驼号称能达到GPT-4的90%性能，下面来体验一下。
项目地址:https://github.com/lm-sys/FastChat
体验地址:https://chat.lmsys.org/

部署

环境搭建

#官网要求Python版本要>= 3.8
conda create -n fastchat python=3.9 
conda activate fastchat
#安装pytorch
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116

安装后测试

conda activate fastchat

import torch
print(torch.__version__)

安装fastchat

pip3 install fschat
git clone https://github.com/lm-sys/FastChat.git
cd FastChat
pip3 install --upgrade pip  # enable PEP 660 support
pip3 install -e .

权重文件

这里由于经费有限，所以使用7B模型，7B大约需要30 GB 的 CPU RAM

python3 -m fastchat.model.apply_delta \
    --base-model-path /path/to/llama-7b \
    --target-model-path /path/to/output/vicuna-7b \
    --delta-path lmsys/vicuna-7b-delta-v1.1

13B大约需要大约 60 GB 的 CPU RAM。执行方式如下

python3 -m fastchat.model.apply_delta \
    --base-model-path /path/to/llama-13b \
    --target-model-path /path/to/output/vicuna-13b \
    --delta-path lmsys/vicuna-13b-delta-v1.1

推理

执行以下命令后，可以在命令行窗口进行对话

python3 -m fastchat.serve.cli --model-path lmsys/fastchat-t5-3b-v1.0

效果如下：

webGuI

FastChat还提供了web界面可以使用，具体流程如下

启动 controller
- 新开命令行，进入fastchat环境执行 conda activate fastchat
- 然后执行命令执行 python -m fastchat.serve.controller
启动 model worker
- 新开命令行，进入fastchat环境执行 conda activate fastchat
- 执行命令执行 python3 -m fastchat.serve.model_worker —model-path /path/to/model/weights
- 如果你显卡内存不够，需要使用CPU，在后面加上参数–device cpu
启动前可以测试一下
- 新开命令行，进入fastchat环境执行 conda activate fastchat
- 然后执行 python -m fastchat.serve.test_message —model-name vicuna-7b
最后，启动 web server，执行 python -m fastchat.serve.gradio_web_server
打开浏览器，访问地址 http://127.0.0.1:7860/

此外还提供了API调用方法，具体可以参考官网调用方法。

人工智能深度学习 Pytorch 自然语言处理 gpt

转载原出处：

打赏 0

上一篇：wsl ubuntu22.04 conda环境安装labelImg解决xcb缺失问题

下一篇：使用Docker快速搭建Hfish蜜罐

精选FastChat(小羊驼模型)部署体验

kuokay

简介

部署

环境搭建

安装fastchat

权重文件

推理

webGuI

为你推荐

STM32复习笔记（九）OLED的介绍和使用方法

Qt通过ODBC连接openGauss数据库

ROS CAN总线设备接入（一）Linux动态库的显式调用

IMU内参标定以及初始化（9轴IMU，比6轴多三个姿态角信息）

基于ROS与optitrack的四旋翼飞机开发流程

经典文献阅读之--Deformable DETR

关于作者

kuokay

15

0

150

2

YOLOv5网络结构，训练策略详解

精选本地部署 langchain-ChatGLM

python和go相互调用的两种方法

相关推荐

（37）安全开关

深蓝学院-视觉SLAM十四讲-第六章作业

精选Java基于正则化批量将String类型的数字转化为Double类型

simulink模块库学习

2019年Robomaster江苏省赛总结

ur机器人编程-程序流程

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

精选FastChat(小羊驼模型)部署体验

kuokay

简介

部署

环境搭建

安装fastchat

权重文件

推理

webGuI

为你推荐

STM32复习笔记（九）OLED的介绍和使用方法

Qt通过ODBC连接openGauss数据库

ROS CAN总线设备接入（一）Linux动态库的显式调用

IMU内参标定以及初始化（9轴IMU，比6轴多三个姿态角信息）

基于ROS与optitrack的四旋翼飞机开发流程

经典文献阅读之--Deformable DETR

评论（0）

关于作者

kuokay

15

0

150

2

YOLOv5网络结构，训练策略详解

精选本地部署 langchain-ChatGLM

python和go相互调用的两种方法

相关推荐

（37）安全开关

深蓝学院-视觉SLAM十四讲-第六章作业

精选Java基于正则化批量将String类型的数字转化为Double类型

simulink模块库学习

2019年Robomaster江苏省赛总结

ur机器人编程-程序流程

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板