第250章论文开写

首页

书架

加入书签

返回目录

请安装我们的客户端

更新超快的免费小说APP

下载APP

终身免费阅读

添加到主屏幕

请点击，然后点击“添加到主屏幕”

    看着两书评论圈里的热闹，以及日涨一千的点击，心情却是不由地好了起来。

    时间还早，习惯夜猫子的他，正是兴奋的时刻呢，不会这么早就去休息的。

    该干些什么呢？当然是开始动工手写人工智能的论文啦！

    其实嘛，英文论文那是现成的，关于负采样训练词向量的，一篇是给出方法，一篇是证明出来，莫浩波需要做的，就是把它们融合起来。

    方法也很简单，就是在前世谷歌论文的基础上，加个证明就好了。

    当然，身为中国人，怎么可能不会写点中文的东西呢？

    现在，重要的问题就是需要做实验，就是训练数据啦。

    那些公开的数据已经从网上下载下来了的，就差工具和应用了。

    13年的这个时候，成熟点的python版本当然是python2.7啦，至于经典的python3.5还没有影子呢。

    不需要使用那些复杂的架构，只需要简单的神经网络就可以实现，使用numpy库就可以了，而这，也恰恰是莫浩波发表这篇paper的原因。

    很快就投入令人向往的自然语言处理（NLP工作），效率是相当快的。

    参数和代码都是现成的，不就是改个文件地址训练么，数据量也不大，也就500M的数据罢了。大的话，他的电脑也跑不起来。

    negtive-sample的cbow大都比cbow效果好，negtive-sample的skip-gram大都比skip-gram效果好。skip-gram大多数情况，也比cbow效果好。

    训练好的词向量各种分类啊，实体提取啊之类的比较，得出对negtive-sample方法有利的证据。

    然后就是各种数据的记录，曲线的绘制了，突出negtive-sample方法的速度性、高效性和准确率。

    科学实验嘛，工程嘛，重要的就是数据啦，这里容不得任何的作假，那是相当严格的，可不是文科那样的写写报告无病而呻那样的可比拟的。

    当然科研类实验嘛，那又是相当简单的，只要你给出的方法，你给出的数据，能够比当前的准确率高，即便没有什么道理，给不出什么理论，那也绝对是真理啊。

    科研嘛，最重要的当然是数据啦，数据是不会说谎的。

    就这样投入进去，时间过得很快，一下子就到深夜11点了，莫浩波终于记录下了他所需要的各种数据。

    接下来用这些数据，把原本论文的数据替换掉，很快，一篇关于自然语言词向量的论文，就大功告成了。

    借助英文-中文翻译，稍微改改其中语句不通顺的地方，中文论文也写好了。

    毕竟两三千字的论文，小菜一碟嘛，莫浩波轻松搞定。

    果断加上作者名，第一作者，当然是我们的莫浩波啦。第二作者，莫浩波果断地加上了思思的名字。

    他已经下定决心，一定要睡服思思，要和他一起选择这个“计算机科学与技术”的专业了。毕竟，生物工程什么的专业，听起来整个人都不好了，不能让她再次中奖了。

    弄完这些，便第二天早上5点了，顶着黑乎乎的眼圈，他沉沉地躺下了，就是早上日常的八点半闹钟，也激不起他的丝丝涟漪，果然变死猪了……