Research Topic

社交机器人是一种活跃在网络媒体和平台中的软件机器人,能够利用计算机算法自动化完成筛选、阅读、发布/转发、评论、点赞等信息生产和消费行为。 传统上,社交机器人被认为是一种负面技术,包括:传播暴力、虚假和恶意等负面信息,限制自由意见交流等。 然而,社交机器人也能够成为智能媒体时代的创新研究和应用工具。

研究组围绕社交机器人相关技术,开展传播学相关理论和应用研究,同时,也致力于提供面向社交机器人实验研究的相关工具集(Crowbar)和数据集。

目前主要的研究主题包括:

  • 互联网媒体传播效果评价
  • 推荐算法黑箱监测与分析
  • 智能社交媒体田野实验方法
  • 信息茧房/过滤气泡机制研究
  • 人机交互理论与实验分析

2024年,计划在北京师范大学(珠海校区)招收”计算传播学“方向博士研究生1名,要求:

      (1)满足北京师范大学新闻传播学院报名基本要求;
      (2)具备一定的大数据分析技术能力;
      (3)有国内外学术论文发表经验优先;
      (4)工作认真细致,能够有效交流沟通;

欢迎有意向同学联系。


Recent Publication

  • Long, J. et al. Social Media Opinion Analysis Model Based on Fusion of Text and Structural Features. Appl. Sci. 13, 7221 (2023).
  • 刘茜, 刘清渭, 闵勇 & 吴晔. AI赋能与人机耦合:AIGC时代的社交机器人. 传媒 23–25 (2023).
  • 闵勇 & 黎樟浩. 被高估的新闻回避:受众新闻阅读行为的研究. 青年记者 23–26 (2023).
  • 刘茜, 汤清扬, 闵勇, 傅晨波 & 赵芸伟. 新闻推荐必然导致“茧房”效应吗?——基于模拟新闻平台的实验研究. 新闻大学 28-43+118 (2023).
  • Li, Z., Zhang, J., Xuan, Q., Qiu, X. & Min, Y. A novel method detecting controversial interaction in the multiplex social comment network. Front. Phys. 10, (2023).
  • Fu, C. et al. Feature Drift in Fake News Detection: An Interpretable Analysis. Appl. Sci. 13, 592 (2023).
  • 李明杰 et al. 新冠疫情下的国际科研合作研究. 电子科技大学学报 51, 928–936 (2022).
  • 傅晨波 et al. 基于超图嵌入和有限注意力的社会化推荐. 小型微型计算机系统 1–10 (2022).
  • Fu, C., Yue, X., Shen, B., Yu, S. & Min, Y. Patterns of interest change in stack overflow. Sci. Rep. 12, 11466 (2022).
  • 傅晨波, 夏镒楠, 岳昕晨, 俞山青 & 闵勇. 一种融合信息网络结构的数据增强行为预测算法. 小型微型计算机系统 43, 568–573 (2022).
  • Han, H. et al. SSLE: A framework for evaluating the “Filter Bubble” effect on the news aggregator and recommenders. World Wide Web 25, 1169–1195 (2022).
  • 闵勇, 周钰颖, 邵安 & 吴晔. 海外网络用户对新冠疫情态度和情感的大数据分析——基于Facebook平台新闻内容和用户点赞行为的分析. 史量才传播学刊 2020, 105–123 (2022).
  • Min, Y. et al. The role of degree correlation in shaping filter bubbles in social networks. Physica A 584, 126366 (2021).
  • Fu, C. et al. A Novel Spatiotemporal Behavior-Enabled Random Walk Strategy on Online Social Platforms. IEEE Trans. Comput. Soc. Syst. 9, 807–817 (2021).
  • 周钰颖 et al. 社交媒体机器人的研究现状、挑战与展望. 小型微型计算机系统 1–11 (2021).
  • 王飞程, 周钰颖 & 闵勇. 多层网络链路预测研究进展. 计算机应用与软件 38, 10–20 (2021).
  • 金诚 et al. 在线社交网络控制实验的现状与展望. 浙江大学学报(理学版) 47, 1–11 (2020).
  • Min, Y., Jiang, T., Jin, C., Li, Q. & Jin, X. Endogenetic structure of filter bubble in social networks. Roy. Soc. Open Sci. 6, 190868 (2019).
  • 王卫红, 梁朝凯 & 闵勇. 基于可视块的多记录型复杂网页信息提取算法. 计算机科学 46, 63–70 (2019).
  • Jin, C. et al. Group-based rewiring rules of binary opinion competition dynamics. Sci. Rep. 8, 14423 (2018).
  • Min, Y., Du, Y. & Jin, C. The effect of link rewiring on a coevolutionary common pool resource game. Physica A 512, 935–944 (2018).
  • Du, Y. et al. A global strategy to mitigate the environmental impact of China’s ruminant consumption boom. Nat. Commun. 9, 4133 (2018).
  • Jiang, J., Min, Y., Chang, J. & Ge, Y. Biological interactions and cooperative management of multiple species. PLoS One 12, e0180189 (2017).
  • Jin, X., Jin, C., Huang, J. & Min, Y. Coupling effect of nodes popularity and similarity on social network persistence. Sci. Rep. 7, 42956 (2017).
  • Wang, W., Chen, M., Min, Y. & Jin, X. Structural diversity effects of multilayer networks on the threshold of interacting epidemics. Physica A 443, 254–262 (2016).
  • Yang, G. et al. Using ecosystem service bundles to detect trade-offs and synergies across urban–rural complexes. Landsc Urban Plan 136, 110–121 (2015).
  • Min, Y. et al. Diversity of multilayer networks and its impact on collaborating epidemics. Phys. Rev. E 90, 062803 (2014).

Free Software

我们将提供一系列与社交机器人开发、运行、部署和监控相关的软件系统。

  • Crowbar单机实验平台(仅限Windows):已经上线,并开放10个内测资源,请联系本人获取资源
  • Crowbar集群系统大屏:web(第一次访问需等待加载必要资源)
  • Crowbar集群系统管理:web(联系本人获取试用账号)
  • 新闻-评论意见标注系统:github
  • 基于内容的实验新闻推荐系统:web(联系本人获取测试账号)
  • 基于Chrome定制的阅读实验APP:apk(今日头条网页修改和访问)

Dataset

数据资源可供科研合作,请联系本人获取资源。
序号 数据集名称 数据源平台 文件大小 规模 时间范围 数据获取方式 采集采购人员 说明
1 新闻+评论数据集 今日头条 448GB 用户12,805,244;新闻3,537,930;评论60,351,733 2017-03至2020-11 自主采集 闵勇,卫宁,龙杰 实际数据主要从2019年开始,联系8~12个月
新浪新闻 用户10,533,283;新闻1,650,663;评论33,734,799 2016-09至2020-06
网易新闻 用户702,666;新闻120,025;评论9,703,218 2015-06至2020-03
2 新闻全文分类数据集 Google News(US) 80.2GB(压缩) 1,588,168 2021-07至2023-09 自主采集 闵勇 每日持续采集,存在部分原文缺失
Google News(CN) 54,058 2023-05至2023-09
Google News(TW) 74,917 2023-05至2023-09
Google News(HK) 48,951 2023-05至2023-09
HuffPost 5,419 2023-05至2023-09
3 Reddit全平台数据集 Reddit 1.78TB(压缩) 全站完整数据 2005-06至2022-08 平台限时开放 闵勇
4 新闻推荐MIND数据集 微软新闻 1.23GB(压缩) 用户1,000,000;新闻161,013;点击记录24,155,470 2019-10至2019-11 公开数据集 闵勇
5 封面浏览记录样本数据集 封面新闻 14.5GB 41,011,683 2019-07至2019-12 平台合作提供 吴晔
6 微博评论数据集 新浪微博 2.81TB(压缩) ≈20,000,000,000 2022-01至2023-05 公司采购 黎樟浩
7 人民日报正文数据集 人民日报 3.46GB 1,067,199 2000-01至2022-05 第三方合作提供 吴晔
8 问答数据 知乎 150G+31M 问题1,500,000和相应回答;用户200,000 自主采集 张伦,闵勇
638M 问题10,000和相应回答 张伦
9 StackOverflow 126G 问题22,306,171和相应回答 2008-07至2022-03 公开数据集

Course

*** 2023 自然语言处理 @ BNU

介绍自然语言处理的基本知识和应用方法。

  • 01:自然语言处理介绍 pptx
  • 02:文本预处理 pptx
  • 03:文本向量表达 pptx
  • 04:Word2Vec pptx
  • 05:文本相似性 pptx
  • 06:Topic Modeling pptx
  • 07:LSTM pptx
  • 08:RNN+Attention pptx
  • 09:Attention pptx
  • 10:情感计算 pptx

大作业:针对软硬新闻分类任务,利用给定的MIND和Google新闻数据集进行文本分类器设计和训练,并在给定的测试数据集(由教师保存)上进行评测。

*** 2023 全媒介素养 @ BNU

从交叉学科角度,重点介绍当今智能互联网媒体的特点、问题、使用技巧和主要议题及问题。

  • 01:网络媒体简介 pdf
  • 02:网络科学 pdf
  • 03:信息极化 pdf
  • 04:假新闻 pdf
  • 05:推荐系统 pdf
  • 06:人工智能 pdf
  • 07:计算思维 pdf
  • 08:意见冲突 pdf
  • 09:刻板印象 pdf
  • 10:社交机器人 pdf

大作业:仿照library.ship.edu,在中文互联网环境中,总结一个话题(topic)的主要内容。必做项为话题简介关键词,可拓展总结该话题的背景、参考文章或书籍、数据库、相关研究机构等。

对于话题(topic)的要求:

  • 长期性:包括怎么变化、发展(话题要与短期事件区分开;如中美冲突)
  • 冲突性:话题并非存在绝对对错,需要有支持者和反对者
  • 自由性:在网络上不那么容易被删帖,能够被讨论的
  • 明确性:能与别的主题区分开,有一定关键词
  • 热门性:要有人参与、能从中获得一定的信息

作业提交模板:Template