Facebook Hate Speech Detection

只要有人類的地方就會有惡意言論,而 Facebook 身為全球最大的社交平台,從以往僱用審查團隊去人工檢視,近年來也開始引入 AI 系統來輔助偵測,在 NLP 領域令人振奮的 BERT 系列模型更扮演了關鍵的角色。 Facebook Hate Speech Detection:背景介紹及以政策面探討 FB 如何審查、定義惡意言論,AI系統對於目前 FB 的影響 Facebook BERT-based System:以技術角度介紹 BERT-based 模型的迷人之處及其原理 背景介紹 Facebook的創辦人馬克·祖克柏曾說:「Facebook的創建理念是,打造一個全球性的社區,加深人與人之間的聯繫,讓世界上的每個人,都有權利與他人分享他所有的事物」。然而,這看似立意良善的理念,卻淺在著一個問題:「並非所有的使用者都是善良的」。 確實,社群媒體上大部分的使用者都是善良的,單純只是想在社群媒體上與自己的親朋好友分享自己生活中的點點滴滴,透過社群媒體,讓人與人間的聯繫不再因物理上的距離而有所限制,可以輕鬆的在平台上與任何人交換資訊。然而少部分心懷不軌的使用者在社群媒體上散佈各式惡意的內容,試圖去攻擊他人,造成他人身心靈上的創傷。雖然這些用戶佔總體的少數,但社群媒體的資訊傳播速度相對於傳統的口耳相傳來的快上許多,任何資訊都可以在社群媒體上迅速的流傳開來,這也使得內容審核、攔截惡意內容成為重要的課題。平台方應設法在不當內容被傳播開來前就將此內容從平台中移除,保障每位使用者有一個善良和諧的社群環境。 內容審核 Facebook 社群守則-仇恨言論 人工內容審核 在過往,社群平台處理這些不當內容的方式是透過人工的方式將這些內容移除,因此也產生了一個新的職業:內容審核員。內容審核員多是由來自於一些開發中國家的人員所擔任,他們的任務就是將社群媒體上適當的內容保存,不適當的內容移除,以維持社群網路環境的和諧。由於他們的工作與維持我們生活環境整潔的清潔人員相似,只差在於一個是清理現實世界中的垃圾,一個是清理社群網路中的垃圾,因此也有人將內容審核員的工作稱作為「網路清道夫」。 雖然內容審核員的工作幾乎不需要什麼門檻就可以加入,但相比與現實生活中的垃圾,存在於網路世界中的垃圾比現實生活中的垃圾來的「髒」上許多,而這個「髒」是屬於心靈及精神層面的髒。當人長時間暴露於這樣不當內容的環境中,是很容易會造成自己精神及身心靈上的創傷。也因為這樣這樣特殊的工作性質,通常大公司都會將這些工作外包到一些開發中國家,由那些家庭經濟狀況不佳的社會底層人士所承擔。但由於工資低廉,加上長時間的精神暴力衝擊,部分審查員因此患上心理疾病,甚至是走上絕路,也有的寧可辭職,回去從事垃圾回收的工作,也不願在看到網路上那些不當的垃圾內容。 綜合上述,人工內容審核隱含的缺點,除了對於審核員的精神及心靈創傷外,對於企業來說也會增加人事成本並且人工審核的方式效率較低。上述這些缺點也凸顯出了自動化內容審核的重要性,也許將內容審核的工作交給不會受情感影響並且處理速度快的電腦做會是一個比較好的選擇,一方面可以較有效率的進行內容審核的工作,一方面也可降低公司對內容審核員的需求,減少公司的人事成本,也可降低審核員的心理壓力。 Facebook 的 AI 內容審核[ref]How We Review Content[/ref] 隨著近年來人工智慧、深度學習相關技術的蓬勃發展,尤其是 BERT 家族模型在各式自然語言處理相關任務上大放異彩,刷新了各項成績。在2020年Q4,Facebook使用RoBERTa、XLM、XLM-R 等BERT相關模型所建構的AI系統已經可以做到將 97% 的不當言論內容在被用戶檢舉之前就自動化的偵測出並且移除,相比於2017年Q4的23.6%,可說是有很大的進步。 ![[Pasted image 20241231160837.png]] 在技術方面,Facebook 的 AI 系統主要在以下三個方面輔助他們進行內容審核的工作[ref]Measuring Our Progress Combating Hate Speech[/ref]: Proactive Detection (主動檢測):AI 精確度已達到可在使用者發現並檢舉違規內容前,就自動檢測出各種類型的違規內容並將其移除,保障平台上的使用者不會看到違規的內容。 Automation (自動化):對於使用者檢舉的內容,在特定情況下,若內容明顯違規 AI 會自動進行判斷並將違規的內容移除。如此可讓審核員更專注於需要更多專業知識才能進行判斷的內容。除此之外,AI 也可自動化判斷被檢舉的內容中是否有重複的,讓審核員可以不用多花時間一直審核重複的內容。 Prioritization (優先排序):有別於一般依照時間順序進行審合的方式,Facebook 的 AI 系統會先將所有不管來自於使用者檢舉或是系統自動檢測出的違規內容依照嚴重性進行排序,如此便能優先處理那些較嚴重違規、對使用者傷害較大的內容。而在排名的部分是依照內容的傳播性、危害嚴重程度、違規可能性等因素進行排序。對於各個違規內容,若系統可明確判定內容違規,則系統會自動的將此內容從平台中移除。若系統無法明確判定內容是否違規,則會將其交由審核員進行後續審核。 Facebook 的仇恨言論盛行率 仇恨言論盛行率是指使用者在 Facebook 上看到違規內容的次數百分比。計算方式為隨機挑選 Facebook 上的貼文作為實驗樣本,這些樣本內可能會包含來自不同國家、文化背景的使用者所發的貼文,因此 Facebook 會將這些實驗樣本交給來自不同語言、地區的審核員進行審核,判定有多少樣本是違反 Facebook 的仇恨言論政策。根據上述的統計方式,2020 年 7~9 月,Facebook 上的仇恨言論盛行率約為 0.10%0.11%。這代表每 10000 篇貼文中,大概有 1011 篇含有仇恨言論的貼文。 ...

February 6, 2021

How to Read a Paper

這學期開始進入正式課程之前,教授提供了一些關於「如何讀 Paper」的文章。對於一位剛要進入研究領域的學生來說,讀文獻是很重要的,用對方法可以節省很多心力,避免變成被論文海淹沒的菸酒生。 以下是我試著翻譯 S. Keshav “How to Read a Paper”,文中提到的三個步驟,「快速地掃過、掌握重點、實際重現結果」透過這樣的方法,可以快速過濾哪些文獻適合閱讀,哪些適合擺到一邊,以及如何閱讀、哪些部分是關鍵。 Abstract 研究員花了很多時間讀 Paper,但是很少人真正學過如何讀 Paper,導致很多人浪費了很多心力。這篇文章提供了讀 Paper 的三個階段(three-pass method)。 1. Introduction 研究員讀 Paper 有很多原因 為了研討會或準備課程 持續更新該領域的知識 透過文獻研究探討新的領域 如何有效率的閱讀文獻很重要,但很少被教授。許多研究生因此需要不段嘗試找出適合自己的方法,浪費很多寶貴的時間,而且常常導致的失望的結果。 多年來我一直用一個簡單的方法來有效率的閱讀文獻,這篇文章中表示為「三階段法」(Three-pass method),而且用這個方法來探尋文獻。 2. The THREE-PASS APPROACH 2.1 The first pass 第一階段,快速的鳥瞰整篇文獻,這大概花 5~10 分鐘,包含以下的步驟。 仔細地閱讀 Title, Abstract 和 Introduction 閱讀 Section, sub-section 的標題,但其他的先忽略 讀 Conclusions 看一下 Reference ,找看看以前看過的文獻 在第一階段結束後,你必須能夠回答以下的問題: 分類:這是什麼種類的文獻?測量?分析現有系統?描述研究的原型? 背景:有哪些文獻和這篇有關?有哪些理論基礎用來分析這個問題? 正確性:內容假設正確嗎? 貢獻:這篇論文主要貢獻了什麼? 清晰度:文獻內容文筆清晰、容易理解? 從這些資訊中,你可以知道該不該繼續讀這篇論文。可能因為 這篇文章你不感興趣 你沒有足夠的知識去讀懂這篇論文 作者做了錯誤的假設 第一階段足以讓你了解這篇文獻是不是該看的,但未來也可能有關。順帶一提,如果你正在寫論文,可以想見大多數的審稿者/讀者都是這樣看待你的論文。選擇有意義標題和副標,要有清晰且全面的摘要。如果一個審稿者沒辦法在第一階段讀懂,那很有可能這篇論文會被 reject,讀者也可能把這篇論文放到一邊。 2.2 The second pass 第二階段,花更多心力閱讀論文,但忽略一些像是證明之類的細節。這讓你可以掌握重點,可以在讀的過程中在空白處寫上筆記。 ...

April 23, 2020

大學備審資料撰寫方向建議

有鑒於學測成績公布,莘莘學子也要進入推甄面試的階段。當年承蒙許多老師幫助,在學測申請時順利的錄取不錯的校系,自己也歸納了一些想法,有時也會突然有可愛的學弟妹跑來問問題,不如就直接寫成一篇文章吧! 申請大學應該是所有人第一次面對非紙本考試,你必須在十幾頁的篇幅中總結你 18 年來做過的事,甚至只有 1 分鐘的時間自我介紹,結果教授花短短幾分鐘,用幾個評量分數就決定你會不會被錄取。如何「篩選」出「最有利」的資訊就顯得更重要了。 發現自己 18 年來都在耍廢,會不會開始想拚指考? 該如何閱讀這篇文章 這篇文章的內容是由資工系大二的學生撰寫,可以大致適用大部分的工程類科系,我不是專家也不負責相關的工作,有一些觀點不一定能通體適用,甚至是我個人的偏見,所以並不能盡信,需要自己咀嚼過後再選擇對自己最有效的策略,希望能拋磚引玉,共同歸納出一份攻略秘笈。你應該多尋求老師、專家、學長姐、同學的協助。 教授的心理 教授的生活除了教學以外,就是研究寫論文、拿計畫,要他負責擔任面試委員就像要你擔任國中升高中的評審委員一樣,教授必須額外花時間來看上百份備審資料,幾乎不會有人認真看完備審資料,甚至大部分內容過度美化或根本就是唬爛的。學測成績是一個可信任的指標,第一階段篩選可以由市場機制粗略的學生區分開來。(6768 級分的學生和 5758 的學生) 就我在大學上課時間的觀察,大部分的教授不太會主動與學生互動,常常是上完課就離開教室,但如果你主動去找教授的話他也會滿熱情回答你的問題。你優秀與否事實上對他沒有直接的影響,甚至很多教授不太管出席率,你的死活和他沒什麼太大的關係。 由於目前少子化的關係,大部份科系都面臨招生問題,收 100 個學生中誰好誰壞要看運氣(很難在短短幾分鐘之內評斷一個學生好壞),但如果報到時只有 80 個學生,這問題就大了,所以這是每個委員都極力避免的。比起挑選學生,現在更多科系是用各種方式來抓住好學生,畢竟大學 4 年如果能將普通的學生變得優秀,也對學校非常有幫助。 我們可以看到一個現象,如果你 70 級分,卻填了一個 60 級分的科系,教授想也知道你把他當備胎,自然而然你第二階段的成績就不會好到哪裡去,寧願把機會留給會來報到的人。 小結 教授認知: 學測成績已經能保證來申請的學生,有一定的水準 不可能仔細看你的備審資料 不可能在短時間內排出學生好壞。長期來看才有影響,只能盡量抓住好的,避免壞的 教授重視: 我要在「短時間」內評斷一個學生 備審內容吹牛吹破天,「客觀成績、獎項」最實際 「報到率」非常重要,幹嘛收不會來念的人呢? 學生的優勢 理解了大部分教授的心理,應該已經可以從備審刪掉一堆廢話了,我們可以用不同的優勢來討論一下有什麼好的策略,以重要度排序的話是: 你的學測成績、平時成績 你在相關領域是佼佼者、有豐富的經驗 你有濃厚的興趣 你有這個科系的特質 你參加很多非相關的活動 你會來念這個科系 你的學測成績、平時成績 這部分可能在備審裡面沒什麼好寫的,不過成績是非常重要、客觀的指標,但你也不能改變了,考不好的先幫你 QQ。不過你到文末就可以知道其實也不用太擔心啦。 學測成績不僅是第一階段的門檻,也是第二階段很重要的評分手段,對教授來說是最快、最方便的標準,正取和備取也常常是照著學測成績分布的。如果你有特別優秀的科目可以特別提出來說,其餘的話如果沒有加分那也不太需要著墨,畢竟在成績單上就會有了。 你在相關領域是佼佼者(極重要) 如果你是佼佼者,對教授來說就是「即戰力」,可以多多培養的人才,讓強者變得更強。你已經明明白白、實實在在的超越了其他面試的人。你不用多去證明你有興趣、多想來念了,你的學測成績、志工經驗還重要嗎? 除了成績以外,你參加過的比賽、活動,都是判斷你的依據。如果有傲人的成績直接大字、加粗、紅字標示,像是自然科能力競試、奧林匹亞,或是參加過的社群、活動,以前累積的_作品_,這些都是超級加分條件。 表現普通的人也可以想辦法在這段時間內準備出作品,即使是小比賽、小活動,都是非常好的加分條件。 你有濃厚的興趣(極重要) 你沒有傲人的成績,但你非常有興趣,對教授來說你就是「潛力股」,期待你大學四年會有很好的成長。大部分的學生不可能都是即戰力,值得培養的人才也是大加分! 基本上,如果你在高中時已經有濃厚的興趣,你應該就會關注相關的議題,如果沒有的話你應該根本沒興趣吧!用舉實際的例子的方式來強調你有濃厚的興趣。可以寫對該領域、科系、學校的理解或平常關注的話題,你必須多多強調你的未來性、成長性,寫一些心得或感想之類的東西,代表你「反思」進而從中「成長」,具體的寫出未來規劃也是不錯的選擇,如:「資訊工程如何改善高齡化社會」、「人工智慧取代傳統人力」、「錄取後,到網路上看線上課程」 表現普通的人可以多涉獵相關知識或消息,在面試時被問到或你錄取後也需要知道這些事吧! 你有這個科系的特質(重要) 你不只是個好學生,也有很多符合這個科系的特質,不只能勝任,說不定還能做得更多。 英文是非常重要的能力,重要度遠遠超乎你的想像!大學讀原文書、看文件、寫期末考考卷,都要用到英文(大概只有通識課會是中文),所以你的英文檢定就更顯重要了!數學也是在工程類科系中可以強調的科目(在工程類科系數學好很吃香)。 自學能力、團隊合作都是滿重要的人格特質,想兩三個點來當作整份資料的主軸,集中火力。 你參加的活動、興趣、嗜好(你必須把他變成「塑造特質」的故事) 你可以將這些活動,提升到「特質」的層次。如果你只是無聊的敘述自己的家庭背景、成長歷程,卻與未來大學沒什麼關係,你自己應該都寫得很痛苦吧? ...

February 24, 2018