Silenced on social media: the gatekeeping functions of shadowbans in the American Twitterverse
shadowban 算法:影子禁令
- search ban(推文无法被搜索):happens when a Twitter user’s tweets are hidden from search results
- search suggestion ban(用户无法被搜索):a user does not appear when people use Twitter’s search interface to look it up
- ghost ban(回复无法被看到):when a user’s replies are not visible to anyone else on Twitter
- reply downtierering(回复被折叠):when the user’s replies are hidden under an interstitial and only loaded on being prompted to do so
Background
platform governance(平台治理逻辑关注的问题)
- whether they enforce systematic bias and whether these effects are stable over time(是否存在系统性偏见,影响是否虽时间稳定)
- whether shadowban actions evince intentionality and if they perpetuate harm(是否存在意向性)
Profile Features(账号特征)
- 假设 1:Verified Twitter accounts(经过认证的 Twitter 账户)
- 假设 2:Older Twitter Accounts(较老的 Twitter 账户)
- 假设 3:Twitter accounts with more bot-like behavior(有更多机器人行为的 Twitter 账户)
Content Features(内容特征)
- 假设 4:The mention of offensive content(攻击性内容)
- 假设 5:The mention of political issues(政治议题)
- 假设 6:The mention of social issues(社会议题)
Social Features(社会特征)
- 假设 7:Accounts with higher social influence(有较高影响力的账户)
- 假设 8:Accounts with tweets that receive high engagement(推文互动量较高的账号)
Method
Shadownban.EU serive
- 分层抽样美国各地的 Twitter 用户
- 使用 Twitter API 和 Botometer API 来收集账号特征(用于判断假设)
- 定期检查每个账号是否被 shadowban
- 查看每个账号推文的数据表现特征(用于判断假设)
- 使用个人资料、内容和社交特征与 shadowban 的情况进行回归,逆向推断 Twitter 的 shadowban 算法。
Sample(抽样)
- 使用地理位置分层随机抽样抽取了 50000 个 Twitter用户
Data Collection(数据收集)
- 查看账号是否被 shadowban:使用 shadowban.eu 的服务
Feature Extraction(特征提取)
Profile Features(账号特征)
- 账号是否认证:布尔值
- 账号年龄:以天为单位,对数标准化
- 账号的机器人行为:使用 Botometer API
Content Features(内容特征)
- Tweet Frequency(推文频率):每天发布的推文数的对数平均数 —— 需要筛选 “活跃用户”(即在审核前 10 天有发推)
- Offensiveness(攻击性):使用人工标记的推文数据训练的模型预测攻击性得分 (Davidson et al., 2017)
- Hashtag Topics(标签话题):使用研究结果进行标签标记 (Bessi & Ferrara, 2016; Bruns et al., 2016; Gallagher et al., 2018)
Social Features(社会特征)
- 静态社交特征:关注者数量、好友数量(假设在分析期间是稳定的)
- 动态社交特征:每次 shadowban 检查前 10 天的用户推文(tweet)和转推(retweet)的喜欢(likes)、转发(retweets)、引用(quote-tweets)、回复(replies)数量
Additional Features(其他特征)
Regression Analysis(回归分析)
使用多元岭回归来预测账号 shadowban 的函数。
Results
描述性统计:各类 shadowban 的用户数量占比
Bot-like behavior is predictive of all shadowbans(类机器行为)
假设 1、假设 2、假设 3 均成立
Offensive speech and partisan content(攻击性内容和涉及党派的内容)
假设 4、假设 5、假设 6 均成立
A higher outdegree of social engagement predicts shadowbans(社会参与度)
假设 7 成立、假设 8 部分成立
Discussion
consider whether shadowbans adhere to the Harm principle
- algorithm are fluid:算法似乎会随时间发生变化
- potentially harm Twitter accounts with less influence:算法优先 harm 影响力小的账号
- accounts that follow many accounts were more likely to be shadowbanned:关注其他账号的多的账号更容易被 shadowban
consider the Intertionality of the harms incurred
- 基于内容的 shadowban 很难 “逆向工程” 的模型预测
- Twitter 没有明显的左右翼倾向
对理论建设的建议
- further exploration of how the norms around behavior and topical discussions emerge and evolve on social media(进一步探索规范的演化过程)
- future research can also do more on consider how users react and adapt to algorithms(探索用户如何适应算法)
Limitations and Recommendations
- shadowban.eu 工具已经不再更新,可能需要使用 hisubway.online11 等替代工具