首页 文章详情

打造本地ChatGPT,简单2步部署Llama3

Crossin的编程教室 | 127 2024-04-29 14:21 0 0 0
UniSMS (合一短信)

现在还没有用上ChatGPT的朋友,平替方法来了,在本地部署大模型 实现与GPT几乎一样的问答效果!

这是一篇关于大模型 本地部署的教程 使用目前最强开源大模型LlaMA3,这篇先总结一种最简单、操作步骤最精简的本地部署方法。 主要有2步。

c5e65773484a1b751f84790cb0c79464.webp

2024年4月19日,Meta公司发布Llama3,共有8B,70B两种参数,分为基础预训练和指令微调两种模型。与Llama2相比,Llama3使用了15Ttokens的训练数据,在推理、数学、代码生成、指令跟踪等能力获得大幅度提升。

使用完全免费。

步骤1:安装Ollama

Ollama可以简单理解为客户端,实现和大模型的交互。ollama软件win和mac都包括:

b573f1faaeb2784252ca8550ac386491.webp

在这里已经为大家准备好,只需要在我的公众号回复消息:ollama,就能下载到软件。

下载之后打开,直接点击Next以及Install安装ollama,安装步骤非常简单。

步骤2:安装Llama

下载Llama3,打开新的终端/命令行窗口,执行以下命令:

      
      ollama run llama3

程序会自动下载Llama3的模型文件,默认是8B,也就80亿参数版本,个人电脑完全可以运行。

等待安装完成:

b1aa08d6dce4f68aabef46289c7414b6.webp

以上就已经安装完毕,到现在大模型已经在本地部署完成。

使用Llama3

打开一个终端窗口,再次输入 ollama run llama3,自动就会启动,进入会话界面:

ca87eeef37017e44e2f37aa3b12f0675.webp

发第一条消息,你是谁,用中文回答,与Llama2相比,Llama3确实在回答速度上大幅提升,基本小于秒级:

280c22b094858625536cd5b54d803ba1.webp

发第二条消息,Python代码,冒泡排序,代码+解释,回答响应非常快,如下图所示:

179d21fceb8bc02eca461e12f0cbab79.webp

再告诉它,用中文回答,返回中文回答结果:

99fda1f164a869373e12d43aa9553349.webp

总结

Llama3 本地部署大模型,这是最精简的一种方法,推荐大家先按照此方法去实践,使用起来。


作者:郭震

来源:郭震AI
Crossin的新书《码上行动:用ChatGPT学会Python编程》已经上市了。 本书以ChatGPT为辅助,系统全面地讲解了如何掌握Python编程,适合Python零基础入门的读者学习。 【点此查看详细介绍】 购买后可加入读者交流群,Crossin为你开启陪读模式,解答你在阅读本书时的一切疑问。 Crossin的其他书籍:



添加微信 crossin123 ,加入编程教室共同学习 ~

9ec418a3f5b6ab41d8289ff95a0aa8bf.webp

感谢 转发 点赞 的各位~
good-icon 0
favorite-icon 0
收藏
回复数量: 0
    暂无评论~~
    Ctrl+Enter