ChatGPT研究自回归语言模型RNN神经网络模型

：22.812MB ：：1 ：2023-06-11 17:39:23

部分简介

这次更新的模型是传统RNN自回归语言模型，使用了向量矩阵算法，以及正向扩散和反向传播神经网络，随机梯度下降算法。
我本身也是刚研究这方面的新手，代码都是手工翻译自c#，对里面的复杂算法和向量传递，一知半解。
至于出来的效果，我也不好评价，可能也跟我只训练了两步有关，或者训练素材太少，又或者本身算法有问题，具体的还得高手们自行分析了。
最终的目的是抛砖引玉，希望有大佬可以搞一个易语言chatgpt模型出来供大家学习，以及理解神经网络模型！
当然我知道，易语言想做大模型，不支持64位和cuda肯定是办不到的，但不妨碍只会易语言的同学对神经网络模型的学习和理解。
这一版的代码比较复杂，但仍然有丰富的注释可供学习！
代码中调用了两个模块，一个是分词模块，有能力的可以删了模块自己写。
同时调用了我自己的模块，主要用了哈希表和取随机数，也可以自行删掉，用自己的。
有一些问题：
1.训练词典越大，训练时间越久
2.学习率越低，学习效果越好
3.训练次数也跟最终效果有很大影响，但不是越多越好，容易过拟合
4.由于易语言双精度小数位数只有6位，会极大影响模型最终效果。

ChatGPT研究自回归语言模型RNN神经网络模型

部分简介

热门推荐

相关文章

栏目分类

排行精选