企业简介

作为中国自动化领域的权威旗舰网络媒体,控制网创立于1999年7月,是中国举行的第十四届IFAC (International Federation of Automatic Control)大会的中国官方组织机构的唯一指定网站。控制网是中国自动化学会专家咨询工作 委员会(ECC)的秘书处常设之地。是北京自控在线文化传播有限公司开设的网站。

  • 公司类型:其他

联系方式
  • 控制网
  • 地址:北京市海淀区上地十街辉煌国际2号楼1504室
  • 邮编:100085
  • 电话:010-57116291 / 59813326
  • 传真:010-59813329
  • 网址:http://www.kongzhi.net
  • Email:mahongliang@kongzhi.net
  • 联系人:市场部
案例详细
标题基于Agent的个性化信息推送系统的研究
技术领域
行业
简介本论文首先对信息推送及其相关技术进行了概述,提出了一种基于Agent来实现个性化信息推送服务的思想,并分析了其优势所在;然后从功能和结构上对基于Agent的个性化信息推送服务系统进行了设计;最后对该系统主要模块的实现思路以及工作流程加以研究和分析设计。
内容

网络经济与信息技术的发展,使得高校图书馆的服务空间日益扩大,个性化服务也逐渐成为新型服务模式的主流。根据数字图书馆个性化信息服务发展的需要,在已有的数字资源优势和个性化技术优势的基础上,本论文研究并构建了“基于Agent的个性化信息推送服务子系统”。该子系统是“图书馆专家知识交换系统”的一个重要组成部分,它是依托知识资源系统,利用相关技术建立起来的一个标准化的知识服务系统平台,可以为用户提供不同层次、多种类型的服务。

一、             信息推送及其相关技术

1、个性化服务

面对网络信息服务的现状,人们在寻求一种将用户感兴趣的信息主动推送给用户的服务方式,也就是个性化的信息推送服务。[1]个性化服务是一种能够满足用户个体需求的服务方式,当前很多领域都提出了个性化服务的概念,例如新闻网站、资源推送系统、信息检索系统等。在数字图书馆领域中,也需要研究用户的行为和习惯,对不同的用户采取不同的服务策略,从而使其信息需求得到最大程度的满足。目前对个性化服务的研究主要集中在信息检索、推送技术等具体的实现技术上。个性化服务的质量取决于具体的推送技术、检索技术以及系统了解用户兴趣的程度。因此,构建个性化的信息推送系统是整个数字图书馆个性化服务的关键。

2、信息推送技术

传统的信息检索方式是一种拉取模式(即PULL模式),必须由用户主动检索才会输出相应的结果。但是随着网络信息容量的急剧膨胀,单纯的信息拉取技术并不能保证用户及时、准确地获取网络信息资源,缺乏一种有效、智能的信息服务和检索机制来保证用户方便、准确的获取所需的信息。人们在网络上搜索信息时,主要存在两个方面的困难:信息过载和信息迷向。为了解决上述问题,信息推送技术就应运而生了。[2]所谓信息推送(又称PUSH)就是网络公司通过一定的技术标准或协议,从网上的信息源或信息制作商那里获取信息,通过固定的频道向用户发送信息的新型的信息传播系统。推送模式是一种广播的模式,它以频道广播的方式使网上的用户被动、有目的地接受需要的信息。

3、结合Agent的智能信息推送

我们将Agent技术应用于个性化信息推送服务之中的原因是基于Agent自身的特点。[3]Agent的自主性、反应性、主动性、社会性及其他属性为个性化信息服务的实现提供了可能。推送技术中最关键,也是首先要解决的问题是对信息的分类及处理。而目前我们面对的信息特点是:信息量巨大,信息类型难以估计和难以人工处理,如何使用机器进行自动处理。针对上述问题,要使推送技术最终得以成功应用,本论文对结合了Agent的信息推送服务系统进行了研究。推送技术的一个发展方向就是在目前的推送技术基础上融入人工智能、知识发现技术、Internet及数据库技术,从而形成智能信息推送技术,这样可以从根本上解决推送技术应用推广过程中所遇到的难题。

二、             基于Agent的个性化信息推送服务系统的总体设计

1、系统功能设计

构建个性化信息推送服务平台的目的就是要改变传统图书馆的被动服务方式,实行主动向用户推送馆藏各种资源的服务方式。本系统的主要功能是能够根据用户兴趣偏好而主动地向用户推送书籍或论文资料。用户可以浏览资源的基本信息,查阅其借阅情况,并可直接阅读全文;同时可以对历史的推送资源进行组织和管理。除此之外,为了体现本系统的智能化和人性化特性,我们将Agent等人工智能方面的技术引入,使得系统不仅能根据用户提交的一些特性提供有针对性的信息,而且能对用户的兴趣进行动态跟踪与智能分析,从而主动地向用户推送其可能需要的信息。

2、系统总体结构

Yahoo  ……  Google

 

信息检索Agent

信息过滤Agent

用户接口Agent

用户

用户反馈Agent

用户

Profile

为了比较好地实现个性化的信息推送服务,就必须解决好用户兴趣建模、信息检索、信息加工和过滤、用户信息反馈的问题,而这几个部分正是整个个性化信息推送服务系统的重要组成部分。由此,我们构建了一个基于Agent的个性化信息推送服务系统的模型,其总体结构图如下:

 

 

 

 

 

                                       1 基于Agent的个性化信息推送服务系统模型

在上图中可以看到,负责用户和系统进行交互的模块是用户接口Agent。系统首先将用户提交的一些个人需求信息保存到用户Profile中,然后根据用户的个性化需求,通过信息检索Agent从信息源检索得到一批信息资源,最后经过过滤之后推送给用户。其中,用户反馈Agent是负责定期将用户的反馈信息提交给用户Profile,以不断修改用户的个性化需求服务的模型。

3、推送服务的实现方式

信息推送的实现方式主要有两种:基于Internet的信息推送、基于数据库系统的信息推送。[4]基于Internet的信息推送主要有以下几种:1频道式推送:这是目前普遍采用的一种模式,它将某些页面定义为浏览器的频道,用户可以像选择电视频道那样接收感兴趣的信息。(2)邮件式推送:用电子邮件方式主动将所推送信息发布给各用户。(3)网页式推送:在一个特定网页内将所推送的信息提供给用户。(4)专用式推送:采用专门的信息发送和接受软件,信源将信息推送给专门用户。由于考虑到信息推送的实时性以及适用范围的普遍性,本系统将采用网页式推送和邮件式推送结合的推送服务方式。

三、             基于Agent的个性化信息推送服务系统的主要模块设计

1、用户接口Agent

用户接口Agent为用户与个性化信息推送服务系统的交互提供了一个接口,用户通过该接口Agent进行注册、登陆系统、查看系统推送给用户的信息资源。在本模块中,最主要的功能是进行用户兴趣的学习。因此,用户兴趣建模是用户接口Agent实现的重要组成部分,也是整个个性化信息推送服务实现的关键。我们首先通过对用户注册信息的分析,建立初始的用户兴趣模型;然后在用户反馈Agent模块中对其不断调整、改进,使之更加符合用户的需求。

2、用户反馈Agent

本系统中考虑采用两种Agent的反馈学习方法:用户行为跟踪学习方法和相关反馈学习方法。用户行为跟踪学习的特点是不需要用户的直接参与,而通过自主地跟踪用户的行为,了解用户的喜好与需求,调整用户兴趣模型。用户相关反馈学习与用户行为跟踪学习的不同之处在于需要用户的直接参与,通过对用户提供的相关反馈信息的学习,改进用户兴趣模型。

用户反馈Agent结合使用以上两种反馈学习方法,定期地对用户检索、浏览等行为的日志及用户提供的相关反馈信息进行分析,不断地调整用户兴趣模型。用户兴趣建模的流程如下图所示:

基本信息

用户兴趣

兴趣建模

用户个性化表

日志

模式挖掘

注册

反馈

行为跟踪

 

 

 

 

 

                                                                 2 用户兴趣建模

在用户兴趣建模的过程中包含两个重要的组成部分:根据用户的基本信息而建立用户兴趣模型,以及依据用户的兴趣反馈和用户行为跟踪而进行模式挖掘。这两个部分都涉及到用户个性化表的构建与修改。

3、信息检索Agent和信息过滤Agent

信息检索Agent利用现有的搜索引擎技术,根据用户提交的查询关键字,在数据源中查找用户感兴趣的相关信息,得到一系列文档集。信息过滤Agent根据用户个性化表中的用户兴趣模型,对信息检索Agent的搜索结果进行再加工和过滤,去除其中和用户兴趣不相关的或相关性不大的信息,最终实现个性化信息推送服务。

信息过滤可以分为基于内容的过滤和协同过滤两种。基于内容的过滤通过计算检索到的文档与用户兴趣之间的相似度,得到文档与用户兴趣的相关程度,将相似度超过一定阈值的文档推送给用户,过滤掉信息检索Agent中检索到的文档中的一些无关信息,使过滤后的文档信息更贴近于用户的需求。协同过滤又叫做社会过滤,它分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度的预测。

在本系统中,考虑采用基于内容的过滤为主,协同过滤为辅的策略。基于内容的过滤是信息过滤的主要实现形式,也是个性化信息服务实现的关键一步。在信息过滤的过程中,首先使用向量空间模型将用户兴趣以及得到的文档表示为向量形式,然后计算两者的相似度,将相似度最大的前N篇文档推送给用户。其具体流程如下图:

结束语

本论文在现有信息推送技术的基础上融入Agent技术,并结合知识发现、Internet及数据库等技术,构建了基于Agent的个性化信息推送服务系统。该子系统作为“图书馆专家知识交换系统”的一个组成部分,为用户提供了一个个性化信息服务平台,扩大了现代数字图书馆的服务空间。

 

 

 

对文档预处理后,

用向量空间法表示

根据用户提交的关键字搜索并返回一批文档

计算该文档向量和用户profile之间的相似度

是否大于某阈值

将该文档提交给用户

 

 

                                                            3 信息过滤流程

参考文献

[1]宋丽哲等.数字图书馆个性化服务用户模型研究[J.北京理工大学学报.200501

[2]吴剑霞.信息推送技术的原理及在图书馆的应用[J.科技情报开发与经济.200403

[3]徐俊萍.基于Agent的个性化信息服务实现技术及其应用研究.东南大学硕士学位论文

[4]彭国莉.信息推送技术与信息推送服务[J.中国信息导报.200108

[5]国家数字图书馆参考咨询台EB/OL. http://dref.csdl.ac.cn/2003

[6]袁丽芬等.基于XML的信息推送服务及实现[J].情报科学.200306

[7]沈钧等.“推送拉取模式的图书馆网络信息服务[J].现代图书情报技术. 200205

[8]张延国.基于搜索引擎的个性化知识推送系统[J].中国信息导报.200406

[9]Manfred Hauswirth. A Component and Communication Model for Push Systems. Springer-Verlag GmbH. May 2003

[10]Chen-Tung Chen. An information push-delivery system design for personal information service on the Internet. Information Processing and Management. July 2002