信息檢索可視化

出版时间:2009-6   出版时间:科學出版社   作者:Jin Zhang   页数:233  
封面图片

信息檢索可視化
前言

飛速增長的互聯網上動態、多樣、異質、復雜的信息和其他信息檢索系統給傳統的信息檢索技術和理論帶來了史無前例的挑戰。這些挑戰使人們對信息檢索提出了加強交互性、直觀性、有效性等要求,也使專家們必須集中精力尋找滿足用戶檢索相關信息的新方法。信息可視化技術可以在一個視覺的、明晰的、交互性的環境下論證數據之間的相關性,它已成為我們應對挑戰的最大希望。信息可視化和信息檢索有著天然的聯系。事實上信息檢索就像一條線一樣貫穿著整個信息可視化系統。信息可視化向用戶提供獨特的方式去檢索信息,它可以把隱藏的信息用視覺的形式呈現,並允許用戶以視覺形式進行檢索。瀏覽作為一種強有力的信息檢索方式將在可視化環境中被充分應用。可視化技術給信息檢索帶來了希望,從信息檢索的角度來看待信息可視化,最終將使信息檢索和信息可視化都受益。本書從理論和實際應用方面,對信息檢索可視化領域最新進展進行了體系化的闡明,評價了這個領域主要的技術和方法,說明了信息檢索和信息可視化的理論關聯,並介紹了信息檢索可視化的主要算法和模型。本書也說明了信息檢索可視化的一些重要的和普遍的問題,如在深度應用中出現的難以評價性、不精確性以及隱喻性。此外,它深度探討了信息檢索可視化在網絡流量分析、網絡信息搜尋、瀏覽等領域的理論和實際應用。在本書的結束部分,作者多角度比較了他所介紹的幾個信息檢索可視化模型。最後,本書探討了信息檢索可視化的重要問題和檢索領域以後探索的方向。本書的讀者將通過此書更好地理解信息檢索可視化的現狀,獲悉主要學者的一些技術、理論發現和前沿進展,信息檢索可視化系統實現的一些充分的、有實用價值的細節,以及這個領域的研究者所必須注意的問題。本書的結構如下︰第1章介紹了信息檢索可視化的一些基礎問題,如為什麼信息可視化技術對于信息檢索非常關鍵;如何從查詢和瀏覽兩個方面加強信息檢索;什麼是基礎的信息檢索可視化範例;在信息檢索中信息可視化的潛在應用和影響是什麼;什麼是信息檢索可視化模型的基礎程序。第2章包含了信息檢索中一些基礎的概念和理論。這些概念和算法,如相似性方法、信息檢索模型、語詞加權算法等,都是後續章節中關于信息檢索可視化模型介紹的必要前提。把這些概念和理論放在一起組成一個章節不僅僅是為了避免在後續的章節中重復介紹,更是為了打好一個理論基礎。
内容概要

本書從理論和實際應用方面,對信息檢索可視化領域最新進展進行了系統的闡述,集中介紹了信息檢索可視化的基本原理及其結構、方法和算法,較為系統地比較了多重參考點可視化模型(MRPBM)、基于歐幾里得空間特征的可視化模型(ESCBM)、探路者關聯網絡(PFNET)、多維尺度模型(MDS)、自組織圖模型(SOM)等五種主要的信息檢索可視化模型,討論了信息可視化系統的評估及信息可視化系統設計中人的行為,分析了信息可視化中的一些特有的歧義現象,並提出解決辦法。 通過本書,讀者可以了解和掌握信息檢索可視化的現狀,獲悉主要學者的一些技術、理論發現和前沿進展,信息檢索可視化系統實現的一些充分的、有實用價值的細節,以及研究這個領域所必須注意的問題。 本書可作為信息科學、計算機科學及相關學科的研究人員、從業者、系統設計者和分析者、網絡管理員、圖書管理員、教育者和研究生的參考資料。
作者简介

作者︰(美國)Jin Zhang 譯者︰夏立新 陸偉 沈吟東
书籍目录

译者序中文版的前言序前言第1章 信息检索与可视化 1.1 可视化 1.1.1 定义 1.1.2 科学可视化和信息可视化 1.2 信息检索 1.2.1 浏览与提问搜索 1.2.2 微观信息与宏观信息 1.2.3 信息空间的空间特性 1.2.4 浏览的空间特性 1.3 可视化的感知与认知 1.3.1 感知 1.3.2 认知 1.4 信息检索的可视化 1.4.1 基本原理 1.4.2 三种信息检索可视化模式 1.4.3 建立一个信息检索可视化模型 1.5 小结第2章 信息检索基础 2.1 向量空间模型 2.2 词语加权法 2.2.1 停用词 2.2.2 逆文献频率 2.2.3 萨尔顿词语加权法 2.2.4 另一个词语加权法 2.2.5 概率词语加权法 2.3 相似性方法 2.3.1 内积相似性方法 2.3.2 戴斯系数法 2.3.3 加卡德相似性方法 2.3.4 重合系数相似性方法 2.3.5 余弦相似法 2.3.6 距离相似法 2.3.7 集成角度-距离相似性方法 2.3.8 皮尔森参数γ相关性法 2.4 信息检索(评价)模型 2.4.1 基于方向的检索(评价)模型 2.4.2 基于距离的检索(评价)模型 2.4.3 椭圆检索(评价)模型 2.4.4 合取检索(评价)模型 2.4.5 析取检索模型 2.4.6 卡斯尼椭圆检索(评价)模型 2.5 聚类算法 2.5.1 非分级聚类算法 2.5.2 分级聚类算法 2.6 检索结果评价 2.7 小结第3章 多重参考点可视化模型 3.1 多重参考点 3.2 多重固定参考点模型 3.3 可移动多重参考点模型 3.3.1 原始VIBE算法描述 3.3.2 关于模型的讨论 3.4 自动旋转参考点模型 3.4.1 视觉空间的定义 3.4.2 参考点的旋转 3.5 信息检索的含义 3.6 小结第4章 基于欧几里得空间特征的可视化模型 4.1 欧几里得空间及其特征 4.2 信息检索评价模型介绍 4.3 基于距离-角度的可视化模型 4.3.1 视觉空间(visual space)的定义 4.3.2 信息检索评价模型的可视化 4.4 基于角度-角度的可视化模型 4.4.1 视觉空间的定义 4.4.2 信息检索评价模型的可视化 4.5 基于距离-距离的可视化模型 4.5.1 视觉空间的定义 4.5.2 信息检索评价模型的可视化 4.6 小结第5章 Kohonen自组织图——一种人造神经网络 5.1 神经网络介绍 5.1.1 神经网络的定义 5.1.2 神经网络的结构和特性 5.2 Kohonen自组织图 5.2.1 Kohonen自组织图结构 5.2.2 SOM算法的学习过程 5.2.3 特征图标识 5.2.4 SOM算法描述 5.3 SOM于信息检索领域的意义 5.4 小结第6章 探路者关联网络 6.1 探路者关联网络的特性/性能和描述 6.1.1 探路者关联网络的定义及说明 6.1.2 算法的描述 6.1.3 图布局法 6.2 信息检索的含义 6.2.1 作者同被引分析 6.2.2 语词关联网络 6.2.3 Hyperlink超级链接 6.2.4 探路者关联网络中的搜索 6.3 小结第7章 多维尺度法 7.1 多维尺度法简介 7.1.1 经典MDS算法 7.1.2 非计量MDS 7.1.3 计量MDS 7.2 MDS技术对信息检索的启示 7.2.1 显示对象和对象之间的距离的定义 7.2.2 MDS显示空间的开发 7.2.3 讨论 7.3 小结第8章 因特网的信息可视化 8.1 引言 8.1.1 因特网的特征 8.1.2 因特网的信息组织和显示的方法 8.1.3 因特网信息的利用 8.1.4 因特网的挑战 8.2 因特网的信息可视化 8.2.1 因特网信息结构的可视化 8.2.2 因特网信息查询的可视化 8.2.3 网络交通流量的可视化 8.2.4 联机讨论历史记录的可视化 8.3 小结第9章 信息可视化中的歧义性 9.1 信息可视化的歧义性及其影响 9.1.1 信息可视化中歧义性的原因 9.1.2 歧义信息可视化的影响 9.2 信息检索可视化模型中的歧义性分析 9.2.1 欧几里得空间特征为基础的信息模型的歧义性 9.2.2 基于多参考点的信息可视化模型中的歧义性 9.2.3 探路者网络中的歧义性 9.2.4 SOM中的歧义化 9.2.5 多维排列的歧义化 9.3 小结第10章 隐喻在信息可视化中的意义 10.1 隐喻的定义、基本要素和特征 10.2 隐喻的认知基础 10.3 心智模型、隐喻和人机交互 10.3.1 人机交互中的隐喻 10.3.2 心智模型 10.3.3 HCI中的心智模型 10.4 信息可视化检索中的隐喻 10.4.1 使用隐喻的基本原理 10.4.2 隐喻性信息检索可视化环境 10.5 隐喻应用的步骤和原则 10.5.1 隐喻应用的步骤 10.5.2 设计良好的隐喻视觉信息检索环境的建议 10.6 小结第11章 信息检索可视化的基准和评价标准 11.1 信息检索可视化的评价 11.2 基准和评价标准 11.2.1 评价标准的影响因素 11.2.2 开发评价基准的原则 11.2.3 评价标准的四种类型 11.2.4 基准的描述 11.3 小结第12章 后记 12.1 简介 12.2 各种可视化模型的比较 12.3 问题 12.4 小结参考文献中英文术语对照表

章节摘录

插图:广泛存在于因特网、OPAC系统、数字图书馆以及其他形式的信息检索系统中的数字信息正在以指数倍增长。每年大约要产生一百万特字节(1TB一1024GB)的数据,其中,99%的是以数字化形式存在(Keim,2001)。这些信息系统中的数据变得越来越复杂,更新速度也越来越快,在日常生活中正在被越来越多的人利用。当具有不同背景、特性、能力、喜好和目的的用户数显著增长时,用户的需求也开始变得更加多样和复杂。因此,迫切需要一种更高效的信息检索手段——这向当前信息检索系统中使用的传统方法与技术提出了挑战。在传统的信息检索系统中,信息检索主要是基于关键词查询,并且,由于用户无法控制内部匹配过程,查询过程是非连续的。传统的信息检索系统还存在一些固有缺陷:内部匹配过程对用户不透明,检索结果以线性列表的形式显示,一次可显示的结果有限,文档间的关系极少用图示展现,检索环境缺乏供用户浏览的交互机制等。这些固有缺陷使得传统的信息检索系统面对信息需求的极度复杂性与海量多维数据束手无策。当前计算机已拥有高速运算能力和巨大存储容量,进而拥有了强大的图形处理能力。这些技术与成熟的现代信息检索理论和人机交互理论相结合促生了信息可视化技术。为了克服传统信息检索系统固有的缺陷,信息可视化技术应运而生。信息可视化是一个新兴的领域,其主要目的是将信息形象化以方便与用户交互。它通过视窗、图标、菜单和定点装置提供前所未有的交互能力。当今计算机强大的图形处理能力已使得这种复杂的可视化展示成为可能。因此,用于信息组织、表示、解释和检索,并且具有直观性与交互性的新的信息可视化方法能够洞察数据集内部,获取丰富的数据关联和数据内容,挖掘数据特点。这种信息检索可视化方法使得人们能够充分发挥自己的灵活性、创造力和想象力来搜寻信息。对于各种类型用户——无论老少、无论是否有使用经验、无论是否有信息检索专业知识、无论是否懂英语——真正优秀的信息检索可视化技术都应该能够满足其需求。图像是信息表达与交流的主要工具。在人类文明进程中,它一直贯穿于人类的智力活动中。早期的可视化展示可以追溯到14世纪甚至更早。当时的宇宙图中,地球处于宇宙的中心,由分别代表四种基本元素、七大行星、黄道十二宫和月相的同心圆围绕着(cresques,1978)。基于计算机的可视化应用几乎是随着现代计算机的发明而诞生的。可是,现代图形理论却是始于定量数据的可视化展示原理及理论的提出(Tufte,1983)。
编辑推荐

《信息檢索可視化》的讀者將通過此書更好地理解信息檢索可視化的現狀,獲悉主要學者的一些技術、理論發現和前沿進展,信息檢索可視化系統實現的一些充分的、有實用價值的細節,以及這個領域的研究者所必須注意的問題。

评论、阅读与下载



信息檢索可視化下載



相关评论与评分
  •     不知道老外怎麼想的,雖然模型是可視化的基礎,不過只是模型數學公式不至于叫visualization吧
  •     內容不錯,曾經听過一次作者的一次講座
  •     正在做聚類的可視化展示,這本書幫助很大。
 

爬虫代理IP   代理IP   好用代理IP   推荐代理IP   百变IP  

社會科學資源網 @ 2018