Machine Learning Algorithms used in NLP (Natural Language Processing)
发布时间:2016-06-01 栏目:机器翻译, 自然语言处理 评论:0 Comments
以下是个人总结,欢迎补充,不好意思写了英文版,懒得翻译了,哈哈:
Natural Language Processing is a very useful domain of using machine learning technologies, and has been developed for many years. Now devices are getting smaller and smaller, NLP becomes a possible better input/output way for small devices.
NLP has below sub-categories:
1. Question answering systems, like IBM’s Watson, iApple’s Siri
2. Information Extraction & Sentiment Analysis
3. Machine translation
4. Word sense Disambiguation
5. Relation extraction
6. Abstract summarization.
Basic techs of NLP are as below:
1. Basic text processing, like Text Normalization, case folding, Lemmatization, segtence segmentation and etc.
2. Part-of-speeech (POS) tagging
3. Named entity recognition
4. Parsing problem.
5. Language Model. This is very useful for machine translation, speech recognition and etc.
NLP uses many algorithms, mostly machine learning algorithms and models, recent years, deep learning technologies like word vector and LSTM (long-short term memory) are also applied to NLP, and get good results.
The algorithms/models NLP might use are as below:
1. Regular Expressions. Used for basic text processing, like word extraction, tokenization, or as features in the classifiers.
2. Decision Trees. Used for sentence segmentation
3. Minimum Edit Distance. To judge the similarity of two strings, can be used in named entity extraction and entity coreference
4. N-grams language model. Simplfy the modle using Markov Assumption.
5. Noisy Channel Model. Used for spelling Correction.
6. Naive Bayes. Used for text classification, like spam dection, authorship identification, assigning subject categories/topics/genres, age/gender identification, sentiment analysis and etc.
7. Traditional classification algorithms like SVM, logistic regression, Maximum Entropy and KNN, also can be used for text classification, relation extraction and etc.
8. HMM and CRF. Used for tagging, named entity recognition and parsing.
9. tf-idf and VSM (Vecotr Space Model). Can be used for Information Retrieval and etc.
留下评论
You must be logged in to post a comment.
近期评论
- Pika发表在《莫里斯蠕虫(Morris Worm)》
- Pika发表在《多组学科研分析》
- crisy发表在《最近关于专利的一点感想》
- walter发表在《机器学习基础知识回顾-马尔科夫过程(Markov Process)》
文章归档
- 2024年3月
- 2024年2月
- 2023年12月
- 2023年11月
- 2023年10月
- 2023年9月
- 2023年8月
- 2023年7月
- 2023年6月
- 2023年5月
- 2023年4月
- 2023年3月
- 2023年2月
- 2023年1月
- 2022年12月
- 2022年11月
- 2022年9月
- 2022年8月
- 2022年7月
- 2022年6月
- 2022年5月
- 2022年3月
- 2022年2月
- 2022年1月
- 2021年12月
- 2021年11月
- 2021年10月
- 2021年9月
- 2021年8月
- 2021年7月
- 2021年6月
- 2021年5月
- 2021年4月
- 2021年2月
- 2021年1月
- 2020年12月
- 2020年11月
- 2020年10月
- 2020年8月
- 2020年7月
- 2020年6月
- 2020年5月
- 2020年4月
- 2020年3月
- 2020年2月
- 2019年7月
- 2019年5月
- 2019年3月
- 2019年1月
- 2018年6月
- 2018年5月
- 2018年4月
- 2018年3月
- 2018年2月
- 2017年11月
- 2017年7月
- 2017年6月
- 2017年5月
- 2017年3月
- 2016年12月
- 2016年11月
- 2016年10月
- 2016年9月
- 2016年8月
- 2016年7月
- 2016年6月
- 2016年5月
- 2016年4月
- 2016年3月
- 2016年2月
- 2016年1月
- 2015年12月
- 2015年11月