自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
585 9.9k 1.8k

Z 专门针对自然语言处理(NLP)的精选资源列表
 
10.0 1.2
  16天前
500 8.7k 2.3k

N NLTK 一套开源Python模块,数据集和教程,支持自然语言处理的研究和开发
 
10.0 2.2
  14天前
Popular
176 5.7k 689

P PyText 是一个工业级的开源 NLP 工具包,可用于在 PyTorch 中开发 NLP 模型,并通过 ONNX 部署。其预训练模型包括文本分类、序列标注等。」
 
10.0 10.0
188 3.7k 1.1k

C 此项目是机器学习、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。
 
10.0 0.2
  15天前
Popular
124 3.7k 384

Z 自然语言处理(NLP) 最佳实践和示例
 
10.0 10.0
81 2.4k 404

H 将汉字转为拼音。可以用于汉字注音、排序、检索
 
9.6 1.0
Popular
503 22.3k 5k

P Pytorch-Transformers - 👾用于自然语言处理(NLP)的最先进的预训练模型库
 
9.0 10.0
Popular
501 22.2k 5k

T Transformers:支持TensorFlow 2.0 和 PyTorch 的自然语言处理预训练语言模型(BERT, GPT-2, RoBERTa, XLM, DistilBert, XLNet…) 8种架构/33种预训练模型/102种语言
 
9.0 10.0
Popular
1.3k 21.9k 5.5k

J jieba:“结巴”中文分词:做最好的 Python 中文分词组件
 
9.0 6.8
758 16.9k 5.1k

Z 手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库等
 
9.0 2.8
  15天前
Popular
1.2k 14.6k 2.5k

Z Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.
 
9.0 6.7
453 10.5k 3.7k

G Gensim是一个Python库,用于主题建模,文档索引和大型语料库的相似性检索。 目标受众是自然语言处理(NLP)和信息检索(IR)社区。
 
9.0 2.5
108 2.2k 390

Y 一个简单的库和命令行实用程序,用以从HTML页面或者明文中抽取摘要。该包也包含用于文本摘要的简单评价框架。
 
8.7 1.0
79 996 240

S spark-nlp:面向Spark的自然语言处理(NLP)库
 
3.0 10.0
45 974 372

G 该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、thchs30四个数据集。
 
2.9 0.0