Mohammad等人使用78个正负向情感词作为种子词汇,从775000条Tweets中抽取情感词汇。
如果一条Tweet包含正向种子词汇,则这条Tweets判定为正向情感,如果一条Tweet包含负向种子词汇,则这条Tweets判定为负向情感。
它们对每个词汇计算正向点互信息(PMI)与负向PMI的差值得分,如果得分为正数,则表明这个词汇为正向情感词汇,如果得分为负数,则表明这个词汇为负向情感词汇。
得分的绝对值越大,表明该词汇的情感强度越强。他们用这种方式构造了新的情感词典,以补充现有的情感词典。