弊大学学部のトレンドワードを調べてみた in Twitter

くぅちゃそ
kineca-developer
Published in
4 min readJul 24, 2019

前置き

*ネタ記事です*

はじめまして!キネカでインターンをさせていただいてる倉林です!

私の学部は情報系の学部で、とにかくTwitterの使用頻度がひどいです。自分たちでTwitter学部と言う人も少なくありません。。。

そんな中、大学では現高校生に向けての説明会などがあるわけですが、私の所属するサークルは教務課から展示会形式での学部の紹介の依頼を受けました。そこで私は「Twitterの使用頻度の多い弊学部のトレンドワード」ということをテーマに検証し、弊学部の特徴を見てみようと考えました。

検証方法

・私の大学用アカウントからTwitterAPIを利用してタイムラインを取得

・取得した文章を形態素解析し、名詞・固有名詞を抜き出す

・DBに保存、充分なデータが集まったら単語の重複数などから分析

今回はキネカでRubyを使っているのでせっかくだからここでも使用

形態素解析にはnatto(https://github.com/buruzaemon/natto)

定期実行にはClockwork(https://github.com/adamwiggins/clockwork)

こんな感じのコードを15分おきに定期実行させます。

@natto = Natto::MeCab.new
@db = SQLite3::Database.new('./db/words.db')
sql = 'INSERT INTO datas(data) VALUES(?)'
@natto.parse(text) do |n|
if n.feature.split(",")[1] == '固有名詞'
@db.execute(sql, n.surface.to_s)
elsif n.feature.split(",")[0] == '名詞' && n.feature.split(",")[1] == '一般'
@db.execute(sql, n.surface.to_s)
end
end

取得結果

今回は9時〜19時の間データを取得し(授業などの関係で所々実行を止めてます) 合計で10849件の単語データが集まった。SQLで単語の重複数を出していくつかピックアップしてみる。(今回はURLの一部や判別の難しい単語は除外する)

SELECT count(*) FROM datas;
=> 10489
SELECT data, count(data) as cnt FROM datas GROUP BY data ORDER BY cnt ASC
=> https|608 ・・・

みんな基本的に11時になると一斉に本田圭佑と熱いカードバトルを始める(ペプシのキャンペーン)。暇になったら質問箱で遊ぶという日課がここ最近出来上がっていた。同時に上映したばかりの「天気の子」に関する話題(本田翼とか)も多かった。あとはWACCA(音ゲー)やニュースに関してなど全体的に新しい話題に関する単語が多く見受けられた。

おわりに

そもそも今回ガバガバポイントがいくつかあり、Twitterのトレンドワードは急激に投稿率の上がったワードをすくい上げているっぽいが、こちらはただ投稿の多かったワードを見ているだけという差が大きく出ていると思う。今後また使用する機会があればそういった部分も含めて改善をしたい。

弊学部はある程度習慣づけられたこと(ペプシキャンペーンや質問箱)以外は新しい情報に割と敏感だと感じた。傾向としても情報学部らしい単語より娯楽関連の単語が圧倒的に多かった。

結論 :授業中にTwitterをいじるのはほどほどにしましょう。

--

--