:22.812MB : :1 :2023-06-11 17:39:23
这次更新的模型是传统RNN自回归语言模型,使用了向量矩阵算法,以及正向扩散和反向传播神经网络,随机梯度下降算法。
我本身也是刚研究这方面的新手,代码都是手工翻译自c#,对里面的复杂算法和向量传递,一知半解。
至于出来的效果,我也不好评价,可能也跟我只训练了两步有关,或者训练素材太少,又或者本身算法有问题,具体的还得高手们自行分析了。
最终的目的是抛砖引玉,希望有大佬可以搞一个 易语言chatgpt模型出来供大家学习,以及理解神经网络模型!
当然我知道,易语言想做大模型,不支持64位和cuda肯定是办不到的,但不妨碍只会易语言的同学对神经网络模型的学习和理解。
这一版的代码比较复杂,但仍然有丰富的注释可供学习!
代码中调用了两个模块,一个是 分词模块,有能力的可以删了模块自己写。
同时调用了我自己的模块,主要用了哈希表和取随机数,也可以自行删掉,用自己的。
有一些问题:
1.训练词典越大,训练时间越久
2.学习率越低,学习效果越好
3.训练次数也跟最终效果有很大影响,但不是越多越好,容易过拟合
4.由于易语言双精度小数位数只有6位,会极大影响模型最终效果。