作者：小傅哥
博客：https://bugstack.cn

沉淀、分享、成长，让自己和他人都能有所收获！

首先我想告诉你，从事编程开发这一行，要学会的是学习的方式方法。方向对了，才能事半功倍。而我认为最快且行之有效的技术技能学习，就是上手实践。先不要搞太多的理论，买回来的自行车不能上来就拆，得先想办法骑起来。

所以小傅哥就是这样，学东西嘛。以目标为驱动，搭建可运行测试的最小单元版本。因为康威定律说；问题越小，越容易被理解和处理。所以在接触 ChatGPT 以后，我时常都在想怎么自己训练和部署一个这样的聊天对话模型，哪怕是很少的训练数据，让我测试也好。所以这个会喷人的傻狗机器人来了！

一、傻狗机器聊天

在基于前文小傅哥《搭个ChatGPT算法模型》的学习基础之上，以 OpenAI 开源的 GPT-2 和相关的 GPT2-chitchat 模型训练代码，部署了这个会喷人的傻狗机器人。但由于训练数据的问题，这个聊天机器人对起话来，总感觉很变态。—— 不过不影响我们做算法模型训练的学习。

此页面为小傅哥所编程的WEB版聊天对话窗口

访问地址：http://120.48.169.252/ - 服务器配置有限，不能承载过大的并发访问。
视频演示：https://www.bilibili.com/video/BV1LG4y1P7bo - 也可以通过B站视频，观看GPT2模型部署演示。

二、基础配置环境

OpenAI GPT2 的模型训练和服务使用，需要用到 Python、TensorFlow 机器学习等相关配置，并且这些环境间有些版本依赖。所以为了顺利调试尽可能和我保持一样的版本。如果你对环境安装有难度，也可以找小傅哥帮忙买一台云服务器，之后我把我的环境镜像到你的服务器上就可以直接使用了。以下是所需的基本环境、代码和数据。

系统配置：Centos 7.9 - 2核4GB内存200G磁盘4Mbps带宽的云服务器
部署环境：Python3.7、 Transformers==4.2.0、pytorch==1.7.0
模型代码：https://github.com/fuzhengwei/GPT2-chitchat - 此代码已开源，含websocket通信页面
模型数据：https://pan.baidu.com/s/1iEu_-Avy-JTRsO4aJNiRiA - ju6m

1 环境依赖

yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-devel

yum install gcc -y

yum -y install libffi-devel

make

make altinstall

部署教程基于GPT2训练了一个傻狗机器人 - By ChatGPT 技术学习

一、傻狗机器聊天

二、基础配置环境

1 环境依赖