GitHub 上有哪些有趣的关于 NLP 或者 DL 的项目?

要有趣,有趣,有趣!
关注者
4,442
被浏览
260,926

21 个回答

karpathy/char-rnn · GitHub

:一个基于RNN的文本生成器。可以自动生成莎士比亚的剧本或者shell代码。

phunterlau/wangfeng-rnn · GitHub

: 基于char-rnn的汪峰歌词生成器

google/deepdream · GitHub

:画出神经网络眼中的世界

facebook/MemNN · GitHub

:memnn的一个官方实现。可以回答诸如“小明在操场;小王在办公室;小明捡起了足球;小王走进了厨房。问:小王在去厨房前在哪里?”,这样涉及推理和理解的问题。

skaae/lasagne-draw · GitHub

:用RNN生成手写数字。

keras/addition_rnn.py at master · fchollet/keras · GitHub

:用RNN自动学会加法规则。

karpathy/neuraltalk · GitHub

:自动根据图像生成文本描述。

一下子就想到这些。另外推荐一个网站,

gitxiv.com/

很多arXiv上面知名论文可以在这个网站找到github的项目链接。

再补充几个:)


1. 项目:“小诗姬” github.com/norybaby/poe

全唐诗作为训练数据。可以写押韵自由诗、藏头诗、给定若干字作为主题的诗。运行环境要求 python3.x, tensorflow1.x


2. 项目:全唐诗分析程序 github.com/MrQianJinSi/ 这个程序最初的诞生是为了写微信公众号的两篇文章,那两篇文章的也大致讲解了程序的原理和流程。 因此,在使用程序之前,强烈建议先读这两篇文章:当我们在读唐诗时,我们在读什么? 计算机告诉你,唐朝诗人之间的关系到底是什么样的? 相应的,程序也主要有两个方面的功能: 分析词频和词向量,对应第一篇文章;构建诗人之间的引用关系,对应第二篇文章。


3. github.com/S-H-Y-GitHub 基于LSTM的中文问答系统. 项目通过建立双向长短期记忆网络模型,实现了在多个句子中找到给定问题的答案所在的句子这一功能。在使用了互联网第三方资源的前提下,用training.data中的数据训练得到的模型对develop.data进行验证,MRR可达0.75以上。


Kaggle上也有一些比较有意思的机器学习竞赛项目,比如基于给定的样本数据对泰坦尼克号上人员的生还情况进行预测。