記《7.21 尋源》:用大數據追溯可疑文宣是怎麼一回事?

0
248

前言:

立場新聞調查報道《7.21 尋源》其中一個重要元素,是利用社交媒體內大數據追本溯源,查證核實監警會報告中引用的「得元朗得天下圖」,以及建制圈子廣泛流傳的「(示威者) 不入元朗就不會有衝突發生」論述,究竟他們的憑據有幾真確可信?

調查發現「得元朗得天下」文宣,最早源自自稱「香港警嫂」的微博大 V「風中微塵」,惹來網民熱議。「風中微塵」一直沒有回應我們查詢,但在 20 日下午 5 時多,轉貼一段本地時政評論指:「7.21黃尸入元朗被元朗村民強勢回擊一事,被黃尸主持認定我是內地的大外宣,還懷疑我和警方合作,故意引黑衣人進入元朗!」帖文獲不少人轉發和留言支持。

此後記旨在補充調查構思和方法,紀錄在索閱公開資訊愈趨困難和步步為營的年代,公民能如何創造工具、運用網絡數據追尋線索。

 

追查方向源起

「示威者帶人入元朗」的說法不是始自今日,回帶到 2019 年 7.21 襲擊事件發生翌日,記者重返雞地現場找尋閉路電視,和商戶閒聊時,就有路過的元朗街坊氣忿地指摘:「唔係黃之鋒帶 500 人嚟,佢哋會郁手?你唔知呀,佢哋帶好多人嚟搞亂元朗!」

7.21 幾日後,流傳的版本演變成林卓廷帶人去搞亂元朗;直至今次報道出街後的留言中,仍有網民堅持是朱凱廸、鄺俊宇、黃之鋒等帶人「光復元朗」。

當年記者已抱有疑問,究竟這些假消息是誤傳抑或是有組織的散播?如屬後者,又是誰人在散播?若有人在背後煽動事件,又與白衣人的有組織襲擊有無關聯?

然後在 2019 年 10 月中,7.21 襲擊事件發生後 3 個月,我們在 Matters 看到一篇文章,首次提出「風中微塵」這線索。在《香港羅生門(π) – 721元朗事件的「真相」與「後真相」》一文中,作者 goodwill 開宗明義指出「721 是整個香港羅生門的核心」,意指各方對事件真相各執一詞,甚至編織謊言終至是非曲直難辨。

作者 goodwill 在文中羅列、分析討論區和微博帖文內容,質疑「7.21 光復元朗」可能是建制「自產自銷」的產物。我們去年和今年曾嘗試聯絡作者,希望進一步訪問或了解其看法,可惜終究未能聯絡得上。沒有這位不知名網民的努力梳理,也許就沒有這次的調查報道。

值得留意的是,「得元朗得天下」圖這疑似假消息並不是單一和個別事件。7.16 放映會後,Telegram 群組曾於 7 月 19 日流傳聲稱是「學生動源」名義發出的 7.21 遊行圖片,呼籲市民到中環、深水埗和元朗「遍地開花」,同日黃昏「學生動源」出聲明澄清絕無有關呼籲,有關圖片全屬虛假資訊。

 

大數據追蹤方法

2020 年 5 月,監警會發表專題報告,裡面引用聲稱來自連登討論區的「得元朗得天下」圖,指「網上開始呼籲人們參加 7 月 21 日在元朗舉行的公眾集會,以抗議 7 月 16 日的放映會遭人滋擾。」我們細看便留意到此圖與「風中微塵」發布的圖片一模一樣,若此圖實屬由微博大 V 率先流傳,監警會報告便可能涉及錯誤資訊。

為此,我們聯絡上一直研究中港社交平台資訊的香港大學新聞及傳媒研究中心副教授傅景華,希望較全面地搜集和研究有關「7.21 入元朗」在社交媒體平台上的歷史痕跡,以追蹤「得元朗得天下」圖的來源。

傅教授自 2011 年創立 Weiboscope 研究項目,透過軟件程式不間斷地下載微博用戶的發帖內容和轉發,以及恢復被刪除的微博內容。自 2019 年反修例運動以來,他又開始從 Telegram 頻道收集文字、相片、影片等訊息,再配合其他社交媒體的數據進行研究。

直至現在,由他和團隊匯聚整合的社交媒體數據資料,可搜尋連登、高登等多個討論區,超過十萬個微博帳戶,數以千計的 Facebook 專頁、IG 帳戶、Telegram 頻道發布的內容,涵蓋行動群組、輿論意見領袖、政治人物、主流傳媒、建制陣營經營的頻道和群組。

礙於資源和技術所限,不可能把所有帳戶及其內容全部下載,在搜集數據來源上,必須設定簡單的過濾。例如集中在影響力較大、有較多轉發和粉絲流量的微博帳戶,以及較常轉發或討論公共議題的 Facebook 專頁等。軟件在搜集原材料時又記錄了每則資料的來源、發佈日期和時間,以確保原始資料的真確性。

在這樣的基礎下,我們以「元朗」作關鍵字搜尋由 7 月初至 7.21 曾出現過的社交媒體帖文內容,再作質性的研讀;而惟恐有相關討論沒有用上「元朗」字眼,我們也用監警會附圖作逆向搜尋,透過軟件辨析圖片以及相關討論。

研究方法的限制

誠然,任何研究方法都有可完善之處,這次的調查也不例外。我們與傅景華教授討論過研究目標後,認同用這個方法追蹤有其限制,但大體上不至於影響調查結果的可信性:

第一個限制是今次的研究範圍只限於出現在公眾領域的討論,即各大社交媒體平台的公開群組、專頁以至帖文內容。一些私人傳訊工具如 WhatsApp 或 Signal 的數據,不在搜集分析之列。

不過,考慮到反修例運動其作為公共事件的性質,以及自運動以來網民多透過公開討論區、以及Telegram 頻道作動員的模式,我們相信此方法已包羅所有最重要的公眾社交媒體平台,所找到的訊息源起及其傳播過程相當具代表性。

第二,社交平台的數據有可能被刪除,導致訊息傳播過程出現盲點。但基於社交媒體轉發和互動的特性,假設一個訊息曾被轉發或引起討論,即使在被刻意刪除下也必定會留下痕跡。而在今次的調研中,我們留意到,並沒有出現大規模和系統性刪除數據的痕跡。

 

軟件不能代勞的質性分析

有從事數據新聞經驗的人必定了解,搜集和儲存數據只是調查的第一步,最艱巨的過程必定是如何梳理和詮釋數據。我們從各大討論區和社交媒體上,搜集得近千項曾出現「元朗」字眼或「得元朗得天下」圖的帖文。

所有帖文內容的質性分析,是電腦和軟件不能代勞,要靠記者用人力細讀和過濾。而為防有所遺漏,除了原帖文外,還要看網民留言,部分在討論區和 Facebook 的帖文少則涉及幾十個留言討論,多則可達一千多個留言;微博和 IG 的內容更是包羅萬有,由元朗樓盤開售到地區著名餐廳、手信都有……記者最後花了逾一星期爬梳所有內容,得出現時結論。

我們發現在 7.16 放映會衝突後,有網民在連登討論區提出「光復元朗」,但並沒有提出在 7.21 進行、亦沒有相關文宣,主流聲音更強調要先集中 7.21 的港島區遊行。而在社交媒體數據資料第一次出現 7.21 元朗集會消息及「得元朗得天下」圖,是源自一個自稱「香港警嫂」、叫「風中微塵」的微博帳戶。

「風中微塵」發帖後不夠 30 分鐘,有關消息開始在 Facebook 建制公開群組出現,更有建制網民附加「元朗一眾鄉紳恭候你們」的圖片。連登討論區第一次出現「得元朗得天下」圖是在「風中微塵」發帖後約一小時,內容是澄清有關消息屬謠言,之後出現的內容大部分也是相同性質。至於 Telegram 頻道,也是在「風中微塵」發帖後約兩小時才出現該圖,但已加上「假消息」字眼。

「風中微塵」如何獲悉此訊息、為何傳播此訊息,我們到目前為止仍不得而知。可以肯定的是,調查結果與監警會報告指,連登討論區用此圖呼籲人參加元朗集會,並不相符。而監警會報告這個被傅教授形容為「不夠全面」的結論,更一度出現在 7.21 白衣人暴動案的開案陳詞中。傅教授指情況令人憂慮,由官方流傳的錯誤資訊,或影響更多人對事件的判斷、造成「滑坡效應」。

我們曾向監警會查詢報告內容是否涉及錯誤資訊,監警會僅以口頭回覆,指報告是根據當時搜集的資料撰寫而成,他們沒有補充。

 

結語

今次的調查更像是一套組合拳,整個調查脈絡並不依賴單一工具,是由不同人士努力建構而成的調查,包括遇襲傷者蘇先生不放棄在討論區追尋真相,找到有關李璧而和「守護香港」糾察牌的線索;網民 goodwill 早在2019 年 10 月撰寫的文章和記錄;傅景華教授團隊建立的社交平台研究項目等等。

在接近真相愈需步步為營的年代,我們並不孤單。在最黑暗之處,仍有人同行。

 

文/蔡玉玲、鄭思思