大数据背景下的Web层次化话题检测与跟踪关键技术研究及应用在线阅读
会员

大数据背景下的Web层次化话题检测与跟踪关键技术研究及应用

陈默
开会员,本书免费读 >

计算机网络数据库6.3万字

更新时间:2024-03-22 20:25:58 最新章节:反侵权盗版声明

立即阅读
加书架
下载
听书

书籍简介

在Web文本挖掘、网络信息智能分析与大数据技术不断发展的背景下,作为网络中的一种流式资源,Web新闻的数量正呈现爆炸式的增长态势,而产生这种情形的根源是社会上不断发生突发事件。针对Web新闻所具有的多维特征,研究大数据背景下的Web层次化话题检测与跟踪关键技术,是一个具有实际意义的研究方向。通过研究话题检测与跟踪关键技术相关的文献,笔者研究并应用了大数据背景下的Web层次化话题检测与跟踪关键技术,同时提出了基于大数据五元组语义描述分析的话题检测关键技术、基于大数据实用性评价的话题检测关键技术,以及基于大数据使用行为分析的层次化话题检测与跟踪关键技术。本书可作为大数据相关专业研究生的参考书,也可作为大数据分析与挖掘相关科研工作人员的参考书。
上架时间:2023-05-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

陈默
主页

最新上架

  • 会员
    这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影
    李渝方计算机12.7万字
  • 会员
    《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发
    张伟洋计算机9万字
  • 会员
    本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训
    李雁翎编著计算机6.9万字
  • 会员
    高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证
    (美)普拉桑特·苏特卡尔计算机11.7万字
  • 会员
    数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的
    苏海波 刘译璟 易显维 苏萌计算机21.6万字
  • 会员
    本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案
    许可乐编著计算机6.7万字
  • 会员
    本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。
    白栎旸编著计算机29.9万字
  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    本书以案例的形式,介绍从思维模型分析到场景实践的数据分析方法。全书围绕“数据分析”与“运营增长”两大关键要素,在系统介绍数据分析思维、数据分析方法、数据采集技能、数据清洗技能等基础知识的同时,以问题为导向,解读运营与增长的关键性业务内容,在获客、激活、留存、变现、自传播循环等各个核心运营环节展开数据分析实战。本书提供案例相关数据集与源码包,适合数据分析、产品运营、市场营销等行业有数据分析具体业务需
    黄佳计算机12万字

同类书籍最近更新

  • 会员
    本书介绍Kafka的技术原理和应用技巧。内容包括如何安装和配置Kafka、如何使用KafkaAPI、Kafka的设计原则和可靠性保证,以及Kafka的一些架构细节,如复制协议、控制器和存储层。本书列举了一些非常流行的Kafka应用场景,比如基于事件驱动的微服务系统的消息总线、流式处理应用程序和大规模数据管道。通过学习本书,你不仅能够深入理解这项大数据核心技术,还能够将所学知识付诸实践,在生产环境中
    (美)格温·沙皮拉等数据库24.3万字
  • 会员
    Oracle12c是Oracle公司推出的基于云计算的云数据库系统。本书根据作者应用Oracle数据库管理系统的经验,在参考Oracle12c原版手册和国内外同类图书的基础上,从应用者的角度由浅入深地介绍数据库备份与恢复的原理及各种备份恢复技术,使读者通过本书的学习,了解Oracle12c云数据库的备份与恢复的基础理论,掌握各种Oracle云数据库备份与恢复方法。本书共分9章,包括Oracle12
    姚世军数据库21.7万字
  • 会员
    本书以Altair为核心工具,通过认识数据、理解数据和探索数据全方位地探索分析数据集的统计可视化形式,以应用数据和案例研究为实践场景,使用Altair数据加工箱进行数据预处理,在此基础上,深入理解不同应用领域和实践场景的数据集的统计可视化模型。本书以实践和练习的方式学习和巩固核心知识,学习形式简单高效,适合大数据相关行业的人士参考,也适合大数据相关专业的高校师生教学和自学使用。
    刘大成数据库10.1万字
  • 会员
    全书分为3篇:第1篇首先会详细讲解存储引擎的全貌,让读者能对存储引擎有一个整体的思维框架,介绍存储引擎的两大分支:基于b+树的存储引擎、基于lsm派系的存储引擎,其次对存储引擎部分涉及的一些数据结构、存储介质等概念做一个简要的介绍,为后面内容的深入学习做铺垫。第二篇主要介绍基于b+树的存储引擎,在理论部分重点回答为什么选择b+树做存储引擎索引结构、b+树存储引擎解决哪些问题以及如何解决。在实践部分
    文小飞数据库18.3万字
  • 会员
    本书是一本探索如何应用图思维和图技术解决复杂问题的书籍。该书针对有兴趣学习如何使用图数据提升工作水平、解决困难问题的实战从业者。该书涵盖了与图数据相关的广泛主题,包括图思维、图数据模型和查询语言,讨论了如何将图数据应用于社交网络、物流和网络安全等领域的问题解决方案。此外,该书还提供了实践指导,包括工具和框架的推荐、设计有效图数据模型的建议,以及如何使用图数据生成洞见和做出明智决策的建议。总的来说,
    (美)丹妮丝·柯斯勒·戈斯内尔等数据库16万字
  • 会员
    作为一名游戏行业的老兵,我从事游戏研发及管理工作多年,经历了单机、客户端游戏、网页游戏以及移动游戏大潮的洗礼。回顾互联网发展的这些年,从门户、电商、社交、搜索到娱乐行业,数据都在扮演着非常重要的角色,流量经营分析、电商分析、搜索分析、社交分析都进入了全盛时代,并从商业变现的角度发挥了举足轻重的作用。然而,游戏的研发、运营、设计在不断进步,作为一种娱乐产业,也作为基于数据的互联网业务,其数据分析则一
    于洋 余敏雄 吴娜 师胜柱数据库20.9万字