自由研究-究竟 Tinder 上的人都在想什麼呢

WEED
5 min readMay 31, 2022

《PART1.究竟 Tinder 上的女生都在想什麼呢》

.

研究動機:
.
我在 Tinder 上浮沉也好一陣子了,但依然還是聊得亂七八糟的,如果能夠大致地了解女生普遍的想法的話,是不是就能聊得更順利?
.
但究竟在交友軟體上的女生多半會在意什麼又追求著什麼呢?不同年紀的女生看重的事情會不會不一樣呢?既然身處資料爆炸的時代,那就靠資料來解決這個問題吧!
.
研究方法:
.
首先把很久沒啟用的 Tinder 自動機器人拿出來爬爆資料,這邊得稱讚一下 Tinder 的更新頻率,明明前陣子還能順跑的程式現在已經不能用了,只好先魔改一波重新上場。
.
而想要了解女生的想法,從她們的自我介紹開始研究應該是個不錯的方向。就我的觀察,除了沒打或者只放 ig 的人之外,其他多數都寫得蠻不錯,會把自己的興趣喜好需求和休閒娛樂打出來,而這些元素應該有機會幫助我們更了解現在的主流。
.
接著就是酷東西了,我找到中研院開發的 NLP 套件 ckiptagger,這玩意兒可以把句子分段變成單詞,於是就能把每個人的自我介紹拆成一個個詞彙,最後只需要統計詞彙出現的次數就能找到流行趨勢了(應該吧)。
.
而不同年紀的女生,也許會有不一樣的興趣和期待,於是我把蒐集到的 2998 位女生依照年齡分成四組,以下是各組前十名常出現的詞彙。
.
A組 18~23 歲(1305 人):
這一組是我研究對象裡面最年輕的一群,在去掉 stopwords* 之後前五名常出現的詞彙如下:
<電影、交朋友、聊天、模特、運動>
.
而只出現在這個年齡層常見的詞彙如下:
<模特、火鍋、書籍、吉他、笑話>
.
另外選五個也蠻常出現的詞彙如下:
<閱讀、狗狗、拍照、展覽、甜點>
.
以這個結果來看,藝文相關類的話題似乎蠻能投其所好,如果真的對相關領域不熟聊聊狗狗或甜點也是個蠻適合的話題。
.
B組 24~29 歲(1288 人):
接下來是次年輕的一群人,目前我的朋友們應該多半落在這個年紀。在去掉 stopwords 之後前十名常出現的詞彙如下:
<朋友、聊天、電影、健身、上班>
.
只出現在這年齡層的詞彙如下:
<相信、大自然、婚姻、失眠、打電動>
.
加選五個常見的詞如下:
<音樂、追劇、交友、鬍子、菸味>
.
從這個年齡層可以看到一些新的興趣和嚐試,例如可能開始健身以及露營接觸大自然,也可能發展成上班+打電動或追劇的居家生活,也會想到兩人交往相關的問題。
.
C組 30~35 歲(329 人):
接下來來到 30~35 的族群,相比於 2X 歲的人來說,這群人會有什麼不同的想法呢?在去掉 stopwords 之後前十名常出現的詞彙如下:
<喜歡、聊天、興趣、人生、咖啡>
.
只出現在這年齡層的詞彙如下:
<棒球、籃球、桌遊、野營、打麻將>
.
加選五個詞彙如下:
<無聊、爬山、互刪、旅遊、美食>
.
這一類別的女生在生活上似乎把自己活得更多采多姿,有各式各樣不同的興趣出現,此外可能是經濟開始穩定的關係,去旅遊和吃美食也開始出現在日常興趣中。另外,這邊出現了一個新詞”互刪”,意思是找到一個對象後互相刪掉對方的 Tinder,代表不再需要用到交友軟體,可能多少表現出對理想對象的期待。
.
D組 35~ 歲(76 人):
接下來是年紀最長的一組,爬到的人數也是最少的,在去除 stopwords 之後常見的五個詞彙如下:
<運動、聊天、阿姨、弟弟、自律>
.
只出現在這組的詞彙如下:
<弟弟、Married、美劇、戶外、潛水>
.
另外選出五個常見詞:
<睡覺、冷靜、電影、燒肉、穩定>
.
由於樣本數篇少,所以整體看來變得有點偏頗。若只單就這份資料來看,對於會開始稱呼配對的男生”弟弟”這點也許是某種成熟女性的自信表現吧?嗎?。
.

《PART2.究竟 Tinder 上的男生都在想什麼呢》
另外附上男生的
18~23 ( 661 人):
<聊天、電影、音樂、健身、朋友>
<大學生、大三、專輯、大二、洋蔥>
<運動、交朋友、工作、新竹、旅行>
.
24~29 ( 1448 人):
<聊天、電影、交友、朋友、生活>
<魔法、自潛、安卓、自閉、平凡人>
<健身、工作、音樂、運動、旅遊>
.
30~35 ( 874 人):
<朋友、電影、聊天、生活、健身>
<責任、EDM、情人、依附、海邊>
<工作、運動、旅遊、美食、新竹>
.
36 up( 278 人):
<電影、健身、交友、旅遊、朋友>
<傷心、PUMP、粵語、太極拳、莫德納>
<工作、新竹、音樂、運動、美食>
.
相對於女生,男生的詞彙重複率超極高,而且如果往前翻幾篇看 Tinder 名字那篇男生名字的重複率也很高,我就問你們這些 Tinder 男真的是當在跑步游泳一樣別人做什麼就做什麼嗎?

而且為什麼新竹那麼多la

.
以上就是這次的研究成果,不得不說中研院不愧是台灣學術的最高殿堂,斷出來的詞的準確度真的頗高,果然台灣人寫的句子還是要用台灣人開發的套件來處理才夠ㄘㄨㄚ,但至於趨勢是否是這樣則見仁見智,畢竟母體只有 2998 人而已。
.
最後希望這份數據也可以讓我的單身朋友們了解一下可能的主流趨勢,早日脫單。

註:stopwords,主要是沒什麼實際含意的功能詞,例如”一個”、”你們”,這樣的詞如果遇到卻沒有排除就會影響判斷(如圖),所以會挑掉。

--

--