允中 编译整理自 Medium 量子位 出品 | 公众号 QbitAI
自然语言处理入门该上什么课,看什么书,有哪些工具可用?Medium作者Melanie Tosik汇总了一份资源,量子位节选了其中的课程、库、教材部分,并进行了简单的说明。
在线课程
斯坦福大学自然语言处理入门课程 教师:Dan Jurafsky & Chris Manning https://www.youtube.com/watch?v=nfoudtpBV68&list=PL6397E4B26D00A269
斯坦福CS224d:用深度学习做自然语言处理 教师:Richard Socher http://cs224d.stanford.edu/syllabus.html 与Manning的入门课程相比,这门课讲解了更高级的机器学习算法,以及用于NLP的深度学习和神经网络架构。
Coursera公开课:自然语言处理入门 https://www.coursera.org/learn/natural-language-processing 密歇根大学提供的NLP入门课程
库和开源工具
spaCy 网站 https://spacy.io/ 博客 https://explosion.ai/blog/ demo https://spacy.io/docs/usage/showcase 一个开源Python库,有很好的用例、API文档和demo应用。
自然语言工具包 (NLTK) 网站 http://www.nltk.org/ 教程 http://www.nltk.org/book/ Python NLP编程的实用入门工具,主要用于教学。
斯坦福CoreNLP 网站 https://stanfordnlp.github.io/CoreNLP/ 一个高质量Java分析工具包
教材
Speech and Language Processing 第二版:http://www.cs.colorado.edu/~martin/slp2.html 第三版:https://web.stanford.edu/~jurafsky/slp3/ 作者:Daniel Jurafsky & James H. Martin 自然语言处理经典教科书,覆盖了这一领域的所有基础知识。第二版可以购买纸质版,也可以在线阅读作者发布的电子版;第三版尚未出版,作者目前发布了部分章节。 本书在国内有中译本《自然语言处理综论》https://book.douban.com/subject/1390499/ 和影印版《语音与语言处理》https://book.douban.com/subject/5373023/ ,可能已断货。
Foundations of Statistical Natural Language Processing https://nlp.stanford.edu/fsnlp/ 作者:Chris Manning & Hinrich Schütze 比上一本书略高阶,主要讲NLP中的统计学方法。 中译本《统计自然语言处理基础》https://book.douban.com/subject/1224802/ ,可能已断货。
Introduction to Information Retrieval https://nlp.stanford.edu/IR-book/ 作者:Chris Manning、Prabhakar Raghavan & Hinrich Schütze 排名/搜索领域的一本好书。 中译本《信息检索导论》https://book.douban.com/subject/5252170/ 。
Neural Network Methods in Natural Language Processing https://www.amazon.com/Network-Methods-Natural-Language-Processing/dp/1627052984 作者:Yoav Goldberg 对NLP领域神经网络应用的深入介绍。 电子版:http://u.cs.biu.ac.il/~yogo/nnlp.pdf
数据集
见Nicolas Iderhoff在GitHub上发布的NlP资源汇总: https://github.com/niderhoff/nlp-datasets 。