当前位置: 首页 > 工具软件 > jqac > 使用案例 >

论文阅读笔记|JQAC050(Twitter的影子禁令)

漆雕原
2023-12-01

Silenced on social media: the gatekeeping functions of shadowbans in the American Twitterverse

shadowban 算法:影子禁令

  • search ban(推文无法被搜索):happens when a Twitter user’s tweets are hidden from search results
  • search suggestion ban(用户无法被搜索):a user does not appear when people use Twitter’s search interface to look it up
  • ghost ban(回复无法被看到):when a user’s replies are not visible to anyone else on Twitter
  • reply downtierering(回复被折叠):when the user’s replies are hidden under an interstitial and only loaded on being prompted to do so

Background

platform governance(平台治理逻辑关注的问题)

  1. whether they enforce systematic bias and whether these effects are stable over time(是否存在系统性偏见,影响是否虽时间稳定)
  2. whether shadowban actions evince intentionality and if they perpetuate harm(是否存在意向性)

Profile Features(账号特征)

  • 假设 1:Verified Twitter accounts(经过认证的 Twitter 账户)
  • 假设 2:Older Twitter Accounts(较老的 Twitter 账户)
  • 假设 3:Twitter accounts with more bot-like behavior(有更多机器人行为的 Twitter 账户)

Content Features(内容特征)

  • 假设 4:The mention of offensive content(攻击性内容)
  • 假设 5:The mention of political issues(政治议题)
  • 假设 6:The mention of social issues(社会议题)

Social Features(社会特征)

  • 假设 7:Accounts with higher social influence(有较高影响力的账户)
  • 假设 8:Accounts with tweets that receive high engagement(推文互动量较高的账号)

Method

Shadownban.EU serive

  1. 分层抽样美国各地的 Twitter 用户
  2. 使用 Twitter API 和 Botometer API 来收集账号特征(用于判断假设)
  3. 定期检查每个账号是否被 shadowban
  4. 查看每个账号推文的数据表现特征(用于判断假设)
  5. 使用个人资料、内容和社交特征与 shadowban 的情况进行回归,逆向推断 Twitter 的 shadowban 算法。
Sample(抽样)
  • 使用地理位置分层随机抽样抽取了 50000 个 Twitter用户
Data Collection(数据收集)
  • 查看账号是否被 shadowban:使用 shadowban.eu 的服务

Feature Extraction(特征提取)

Profile Features(账号特征)
  • 账号是否认证:布尔值
  • 账号年龄:以天为单位,对数标准化
  • 账号的机器人行为:使用 Botometer API
Content Features(内容特征)
  • Tweet Frequency(推文频率):每天发布的推文数的对数平均数 —— 需要筛选 “活跃用户”(即在审核前 10 天有发推)
  • Offensiveness(攻击性):使用人工标记的推文数据训练的模型预测攻击性得分 (Davidson et al., 2017)
  • Hashtag Topics(标签话题):使用研究结果进行标签标记 (Bessi & Ferrara, 2016; Bruns et al., 2016; Gallagher et al., 2018)
Social Features(社会特征)
  • 静态社交特征:关注者数量、好友数量(假设在分析期间是稳定的)
  • 动态社交特征:每次 shadowban 检查前 10 天的用户推文(tweet)和转推(retweet)的喜欢(likes)、转发(retweets)、引用(quote-tweets)、回复(replies)数量
Additional Features(其他特征)
  • 评估政治意识形态:当前很难使用布尔值计算

Regression Analysis(回归分析)

使用多元岭回归来预测账号 shadowban 的函数。

Results

描述性统计:各类 shadowban 的用户数量占比

Bot-like behavior is predictive of all shadowbans(类机器行为)

假设 1、假设 2、假设 3 均成立

Offensive speech and partisan content(攻击性内容和涉及党派的内容)

假设 4、假设 5、假设 6 均成立

A higher outdegree of social engagement predicts shadowbans(社会参与度)

假设 7 成立、假设 8 部分成立

Discussion

consider whether shadowbans adhere to the Harm principle

  • algorithm are fluid:算法似乎会随时间发生变化
  • potentially harm Twitter accounts with less influence:算法优先 harm 影响力小的账号
  • accounts that follow many accounts were more likely to be shadowbanned:关注其他账号的多的账号更容易被 shadowban

consider the Intertionality of the harms incurred

  • 基于内容的 shadowban 很难 “逆向工程” 的模型预测
  • Twitter 没有明显的左右翼倾向

对理论建设的建议

  • further exploration of how the norms around behavior and topical discussions emerge and evolve on social media(进一步探索规范的演化过程)
  • future research can also do more on consider how users react and adapt to algorithms(探索用户如何适应算法)

Limitations and Recommendations

  • shadowban.eu 工具已经不再更新,可能需要使用 hisubway.online11 等替代工具
 类似资料: