何烩烩的博客

  • 首页
  • 标签
  • 分类
  • 归档

jupyter notebook

发表于 2018-12-26 | 分类于 学术

为了做数据分析,安装了jupyter notebook。

阅读全文 »

pip安装软件

发表于 2018-10-10 | 分类于 工作

今天下午用pip安装aiml的时候出现报错,原因是版本太旧。用pip install —upgrade pip更新自己也会报错。

阅读全文 »

不平衡情绪分类

发表于 2018-08-31 | 分类于 学术

​ 之前导师让我做过一段时间的“针对多标记情绪分类中的不平衡问题”,我用了过采样、欠采样方法都没有提升。最近看了一篇李寿山老师组的论文,“基于多通道LSTM的不平衡情绪分类方法”[1]。

阅读全文 »

Next主题配置

发表于 2018-08-30 | 分类于 工作

感觉Next主题比landscape-plus好看,所以给博客换一个主题。

1 站点配置

​ 在hexo的_config.yml(站点配置文件)中,

1
2
3
4
5
6
7
# 设置主题
# theme: landscape-plus
theme: next
#设置语言
# language: zh-CN
language: zh-Hans
阅读全文 »

gensim库word2vec的使用

发表于 2018-08-30 | 分类于 学术

(1)安装

1
pip install gensim
阅读全文 »

FastText

发表于 2018-07-31 | 分类于 学术

FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,

1
2
3
4
5
6
7
8
9
1) fastText 文本分类
paper:A. Joulin, E. Grave, P. Bojanowski, T. Mikolov, Bag of Tricks for Efficient Text Classification
https://arxiv.org/abs/1607.01759
2) 词嵌入学习
paper:P. Bojanowski*, E. Grave*, A. Joulin, T. Mikolov, Enriching Word Vectors with Subword Information
https://arxiv.org/abs/1607.04606
github链接:<https://github.com/facebookresearch/fastText>
阅读全文 »

利用Word2vec训练词向量

发表于 2018-07-31 | 分类于 学术

​ 选用不同的词向量作为模型的初始值,效果的差异非常大!所以选择一个好用的词向量还是很重要的。中英文的词向量的处境不同:

1
2
英文的词向量可以训练,也可以用Google训练好的那个模型。
但是中文就不行了,没有公布一个权威的词向量。
阅读全文 »

BP算法

发表于 2018-06-19 | 分类于 学术

20180617BP

阅读全文 »

特征选择

发表于 2018-05-16 | 分类于 学术

​ 刚开始做文本分类的时候,用的是传统的文本分类方法,包括特征选择(MI、IG、CHI)、文本表示(BOOL、TF、TFIDF)、文本分类(朴素贝叶斯、SVM)、模型评估(acc、precision、recall、fscore)。

阅读全文 »

不平衡样本的处理

发表于 2018-04-13 | 分类于 学术

​ 最近阅读了魏老师的“解析卷积神经网络”中的“不平衡样本的处理”,做了一些笔记。

​ 针对不平衡样本,主要有数据重采样和代价敏感学习两种方法。

阅读全文 »
12…4
何烩烩

何烩烩

36 日志
2 分类
13 标签
GitHub 微博 知乎
© 2018 何烩烩
由 Hexo 强力驱动
|
主题 — NexT.Mist v5.1.4