Glossika 2020暑期實習心得

抱著一顆熱愛英語的心加入Glossika,卻一腳踏進了語言學的世界。

Jasmine
12 min readAug 28, 2020

然後花了整整兩個月與英英字典及google sheets朝夕相處。Wait a second!在簡介我負責的專案之前,先來談談Glossika是什麼。

Glossika的Logo,個人覺得很Q(有點像老闆Michael

Glossika: 結合人文與科學的語言(教學)平台

將教學括弧起來,是因為Glossika目前在市面上的確是個語言學習平台,人文精神在於用戶有超過60種的語言可以選擇學習;科學精神則是強調學習新語言的方法,透過間隔重複(spaced repition),也就是重複的聽、讀、錄音該語言,反覆練習日常生活當中常用的句子、將它們轉換成長期記憶。這種學習語言的方式不受限於時間及地點,有別於其他的英語學習平台主打真人1對1互動、外師授課為主。

不過老闆Michael有更大的願景,除了繼續壯大Glossika平台之外,他集結自身對於各種語言的知識與熱情打造另一個平台VIVA,裏頭包含更多樣化的語言、語系分支、句型、單字分類等等,目的在於將一個個龐大、完整、有系統的語言資料庫靈活、廣泛地運用在生活當中。

舉例來說,將語言資料庫(database)餵食(沒錯,就是feed這個字!)給AI或機器人好讓他們瞬間變身mutilingual~(這個過程叫做machine learning,聽起來是不是很厲害,我自己聽起來是覺得蠻神的啦),又或者是以crowdsourcing(眾包)將資料庫販售給有多種語言需求的企業公司,類似B2B的概念。

如果說Glossika接下來要打造的產品是一個大型機器,那麼我便是組成這部機器的齒輪底下的一顆螺絲釘。

Linguistics Intern, Research & Development 語言學實習生,研究開發小組

每天早上8:59分,我與其他實習生一同前往老闆的辦公室,(沒錯,我們工作的地點不在辦公室,我之後會花一個完整的段落介紹我兩個月的工作空間 — 共享辦公室,因為我超喜歡der!),9點00分準時進行Stand-up meeting。

Stand-up meeting是每天早上5–10分鐘與老闆及其他實習生開的極短會議,總結昨天工作項目的進度及報告今天的工作目標,確認we’re on the same page,也可在這時候向老闆提出昨日遇到的疑問或困難。

“I did around 2,500 tokens yesterday, and I will continue doing the tokens today.”

這大概是我每天早上的報告內容,唯獨從tokens換成frequencies換成levels換成lemmas又換成了MWEs,每日完成數量也會有所起伏。

那上述提到的一串英文字分別代表什麼意思呢,讓我們稍稍進入語言學的世界。

由於Glossika打造的新平台VIVA旨在打造多種語言、系統化的完整資料庫,我們這些實習生的主要職責就是建立英文這個龐大的資料庫。最初輸入140,000+的英語單字、片語,及其詞性、時態變化、單複數等,統稱為tokens。隨即從頭到尾檢查google sheet上的tokens是否拼寫錯誤、漏標等。(這兩個步驟便花了我們整整一個月)。

資料庫的雛形是我們耗費心血輸入的那14萬tokens(翻譯成中文才明白有多麽多XD),接下來的任務是將它們系統化,也就是標記它們的頻繁使用率(frenquencies) — 是否為日常生活會用的字?還是艱澀、連母語人士都不知道的字?和難易程度 (Levels) ,分成等級1–12,1是最簡單口語化的字,多數為常用的現在式動詞 (ex: like, work);12則是technical word,可能是從事該專業領域才會曉得的term (ex: hermaphrodite,意思是雌雄同體,btw)。將tokens標上level目的在於使語言初學者有個明確的參考指標,一般來說大部分人會先從level低的單字學起 — 越口語、實用,隨著學習時間拉長、對於該語言有較好的掌握度再往較高level的字學。

雖然我們善用google sheet的公式整理、歸類、甚至演算出大量tokens的難易程度,但語言本身是一個相當主觀、且會因文化、時代、區域不同而相異的學問,因此還是得靠人力去檢查或判斷tokens的難易程度應該被歸在哪一個level。為了使每個token的level不會因人而異,我們構思並創立了一個參照表,每當對於某token的level有歧異時,就以它當作標準降低人為誤差。

以上,大概就是我兩個月在Glossika linguistics team的實習內容,由上述可知,我們一天要處理幾千個tokens,日積月累下來,這項職責培養我細心、謹慎的程度(雖然還是常常被老闆抓出typo..)、大大擴充我的英語字彙量(每天3hr plus與英英字典為伍),此外,這是份較為靜態的工作,長時間久坐面對著google sheet及密密麻麻的tokens考驗我的專注力及耐心持久度。

最後,這份實習也讓我重新思考自身對於語言的態度,我始終熱愛英語這個語言本身,也對我的英語程度相當有自信,但透過這份實習,我接觸到語言背後的邏輯與系統性歸類,雖然不能說讓我更愛英文(笑),卻替我打開了一扇通往更博大精深的英語世界的大門。

整整一個月與這堆(1000多頁!)的英英字典影本為伍

投以英/中文,報之以___文,之老闆Michael &公司文化

(同事另有一個篇幅,因為我太喜歡他們>//<)

標題底線處請填上你可以想到的任何語言,因為…老闆本身是個語言學家啊(跪)。

Glossika的老闆Michael是個美國人,1996年就來台灣深根,說著一口超溜的中文,剛加入Glossika時我問他中文怎麼說的那麼好,他反問我幾年出生,我答1999,他回我:「我1996年就來台灣,說中文的時間比你還長呢!」

好有道理欸XD

但這不只是他驚人之處,他可以隨筆寫出中文字(字跡很好看!)、日、韓文,會說/讀俄文、粵語、台語、台灣各族的原住民語…(天知道他會幾種語言!?)

實習期間讓我印象很深刻的一件事是,Michael曾經短暫的在我們一大早來實習、正式開始工作前,給我們每個人20分鐘的語言學小考,內容分別是日文、史瓦希利語、亞美尼亞語。我們當中沒有人會這些語言,因此測驗目的不在於看誰認識比較多語言,而是訓練我們透過語感、仔細觀察,找出語言的重複、規律性,以推敲出該句話的大致意思,進而有辦法回答問題。藉由這幾次牛刀小試,我發現不論是哪個語言,字根字尾、動詞名詞的變化都循著一定的pattern,而這點也可顯示出語言是一套具有邏輯的系統,對只學習過中、英文及少許韓文的我感到相當新鮮有趣。

Glossika是新創公司,公司組成有老闆Michael、HR兩個超nice的姊姊Sheena跟Claudia、以及負責經營Glossika/VIVA平台的前後端工程師,外加我們linguistics team及其他幾個summer intern,前前後後加起來大約20人上下。由於公司創立時間短、規模小,尚未有完整的intern program,也不像許多公司有mentor/mentee制度,反觀,Michael本身就是大家的mentor! 我們職務與語言相關,有什麼疑難雜症,Michael 5秒替你解決。

另外,有鑒於老闆本身是美國人,公司文化走美式路線,除了實習時數固定:每天早上9點到下午6點,中午休息1小時之外,請假制度自由。(像我一天到晚都在請假,Michael拍謝啦><),我們在工作上有很大的自由空間,只要確保有精準地輸入tokens進資料庫裡,老闆一般是不會在旁邊監督,也沒有主管與下屬之間的壓力,反倒是Michael忙了一陣子就喜歡來我們這裡聊天打屁,與老闆的互動就像朋友之間一樣喜歡互虧、開玩笑,Michael也常常開啟他的mutilingual能力,英文講一講穿插中文,偶爾還會迸出一句台語,然後…然後我就不知道該用什麼語言回應他惹XD

老闆Michael與他的Alchohol

Kafnu — WeWork 共享辦公室 (Co-working Workplace)

我加入Glossika、在西華飯店附近的Kafnu共享辦公室實習一個月後,公司便一舉大遷移到信義區的WeWork共享辦公室大樓,在搬家期間還短暫在南京東路的工作室待過2天。

共享辦公室真的是一很神奇的地方,大夥兒圍坐在公共區域的沙發工作時,身旁可能經過幾個操著日語、韓語,西裝筆挺的商業人士,後頭緊跟著打扮隨性、身著polo衫與短褲的西洋面孔。

我想老闆青睞共享辦公室的原因除了上述提及公司規模並不大、員工人數少之外,共享辦公室是歐美流傳來亞洲的工作模式,環境流動性高、氛圍無拘無束,與老闆的美式價值觀相符。老闆與正職員工在一個透明的四方形空間裡工作,我們實習生則在寬敞的公共空間落腳、找個溫暖的窩執行各自的任務。

WeWork的公共空間

公司在八月搬到位在信義區的WeWork大樓之後,我每天都很期待去實習(不是說之前不期待辣),除了在頂樓18層可以看到絕佳101景致與蘋果旗艦店屋頂的大MacBook之外,上下班走在信義區新光三越、微風集團的百貨公司林立的街道上,自己正位在台北最繁華的商業核心的滿足感油然而生(不過很快就會被38度的高溫烤得無法自我感覺良好。)

WeWork外部
跨年來辦公室看煙火:D
蘋果旗艦店的屋頂是個MacBook

噢對了,公司一樓還有免費手沖咖啡(拉花拿鐵通通有),Wework本身也會不定期推出許多活動 ex:海尼根喝到飽、中秋節月餅試吃等!(大加分!!)

外面一杯100up的拿鐵免費喝就是爽

最寶貴的資產 — 同屆實習生們 (i luv u guys~)

由於最初的工作性質屬於獨立作業 — 大家各自輸入tokens到同一份google sheet當中,實習生們很晚才真正打成一片(也可能各位都是慢熟的氣質文青:)。以我自己來說,我是公司搬到Wework、工作時與大夥兒坐在一起,有比較多機會與時間跟其他人互動,才逐漸熟悉彼此的。

認識大家後,才驚覺大家各個身世背景不凡、臥虎藏龍!(其實很早從各位的談吐舉止就可以看得出來了,大家心知肚明,只是不點破)。但由於保護隱私以及我不想寫的太直白有失美感,我就大概描述一下我親愛的同事們、我們的互動日常、團隊合作型態,和我從他們身上學到的事。

我是linguistics team團隊中,年紀最小的實習生,但其他實習生們並不會因為年齡落差改變彼此溝通的方式,大家一律平等、擁有同等的發言權,且一起討論工作內容、解決問題時也相互尊重、採納各方意見。有能力、有想法的人可以恣意拋出點子,看是否可行,可行的話就採用他/她的建議,卻不會功勞集結於一身,大家都有著這個專案是每個人付出心力完成的共識。

專案以外的日常互動當中,我從其他實習生身上學到了許多珍貴的特質,像是某個實習生如同大家長一般,總是關照著團隊的每一個人,9:01分有人還沒到公司便line對方詢問;有人是每天午餐的外訂小天使,有人組織能力強、有條不紊,擔任傳遞老闆訊息的好幫手,有人鬼靈精怪點子多,總能迎刃而解專案上遇到繁瑣難解的問題。

此外,對我來說另一個bonus是大部分的實習生皆已大學畢業或出社會,社會歷練相對豐富,他們分享自己過往經歷、職涯上的轉折、及價值觀是促使我對於自身未來更加有想法的養分,每次他們娓娓道來自身、或身邊的人的故事,我都聽得津津有味,想丟棄手邊的工作聽他們講一整天(喂!

Last but not least,我相信各位(包括我自己)都是因為喜愛英語、或擁有厚實的外語背景而加入Glossika,也因此,我覺得(也可能只有我自己這樣覺得)大家的頻率相近,感興趣的事物類似,彼此之間有著特殊的默契。這種感覺有點微妙、難以言喻 — 我們之間相處輕鬆自在,甚至在一到五每天膩在一起8小時的情況下,星期六還是會約出來聚聚,這大概就是屬性相同的人傾向聚在一起的實際例子吧。(難得一見的好緣份啊QAQ)

星期六晚上跟老闆去bar喝酒

說了這麼多…

我大學第一份實習就獻給Glossika了,對於第一次實習就能體驗如此西式、探索性質高,意味著機會豐富、潛能無限的公司文化、遇到一群與自身同質性高的同事夥伴們、且在如此優質的工作環境裡悠遊 — 這般特殊的經歷,實屬難能可貴。

--

--

Jasmine

Born in Taipei, Taiwan. 總是對未知感到焦慮,還好文字是安定人心的力量。