YahooNews Classification ##(1)利用python爬虫从日本雅虎网站获取新闻(政治,经济,体育等类别),使用Mecab做日文分词。 ##(2)对分词结果用机器学习包sklearn(SVM等分类器),深度学习工具Keras(tensorflow)的CNN,训练分类模型。 ##(3)使用自然语言处理工具Gensim,训练Word2Vec,实现新闻相似度计算和词汇相似度计算