BBS(Bulletin Board System),俗称“电子布告栏”、“电子公告牌”,别名“论坛”。目前,各大高校的校园BBS均同时支持Telnet和Web两种登录方式,比如水木 清华、瀚海星云等。BBS虚拟社区中的信息传播集中体现了网络传播隐匿、交互、跨时空及信息海量的特性,给对BBS虚拟社区的研究、管理带来很大的挑战。 在这种情况下,针对BBS的数据挖掘、分析技术的研究就显得非常必要了。 数据挖掘实验室
地位与核心问题
BBS数据挖掘是指综合应用Web挖掘、TDT、社会科学等领域的理论、技术,获取、分析BBS上话题和社区结构,为进一步研究BBS、构建基 于BBS的应用提供数据源和技术支撑。相对于底层的Web挖掘、TDT、社科理论而言,BBS挖掘是一个应用领域,而相对于上层的各领域应用需求而言, BBS挖掘是作为技术支撑的基础性研究。
包括所有可能的BBS挖掘应用需求,列出的仅仅是几个主要方面:
1.新闻传播与舆论导向方面的应用迫切需要BBS挖掘技术完成对BBS上信息的归类、提取自动化。要实现舆论导向,首先要知道当前舆论热点是什 么,这是BBS挖掘中的话题发现研究的内容;知道了热点话题后需要了解话题的传播态势,这是话题追踪的研究内容;分析舆论产生的人群基础,这是虚拟社区结 构分析的研究内容。 数据挖掘研究院
2.市场营销与安全管理都需要较强的自动分析能力。因为BBS的信息海量特点,完全人工处理是不切实际的。分析帖子观点的倾向性,挖掘潜在的用户群,挖掘用户反馈信息,过滤敏感话题都需要BBS挖掘对内容、社区结构的自动分析能力。 数据挖掘实验室
3.随着BBS的“升温”,社会学研究对其关注也迅速增加,但是在研究方法上定量分析的力度不够,亟需更强的BBS挖掘、分析能力。BBS挖掘技术可以为社科研究提供有力的数据支撑。
以上各领域的需求归结于两点:话题发现与追踪(针对BBS的内容分类、分析自动化)、虚拟社区结构分析(对用户群结构、交互方式的研究)。这两点是BBS挖掘的核心。
一方面它借助于Web挖掘、TDT、社科理论已有的研究成果,利用已有的技术手段去分析BBS上的对象:BBS上的话题发现与追踪、虚拟社区结构分析。但是由于BBS自身的特点,引入的各项技术都将有所改进,而且BBS自身的特点也产生具有特色的新技术。
研究现状国外的研究 数据挖掘研究院
2002年,日本东京大学的Naohiro Matsumura,Yukio Osama和Mitsuru Ishizuka提出影响力传播模型IDM(Influence Difusion Model),用于对BBS上有影响力的人物和话题的发现。IDM假定:

