面向Web的数据挖掘
Web上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。相对于Web的数据而言,传统的数据库中的数据结构性很强,即其中的数据为完全结构化的数据,而Web上的数据最大特点就是半结构化。所谓半结构化是相对于完全结构化的传统数据库的数据而言。显然,面向Web的数据挖掘比面向单个数据仓库的数据挖掘要复杂得多。
1.异构数据库环境
从数据库研究的角度出发,Web网站上的信息也可以看作一个数据库,一个更大、更复杂的数据库。Web上的每一个站点就是一个数据源,每个数据源都是异构的,因而每一站点之间的信息和组织都不一样,这就构成了一个巨大的异构数据库环境。如果想要利用这些数据进行数据挖掘,首先,必须要研究站点之间异构数据的集成问题,只有将这些站点的数据都集成起来,提供给用户一个统一的视图,才有可能从巨大的数据资源中获取所需的东西。其次,还要解决Web上的数据查询问题,因为如果所需的数据不能很有效地得到,对这些数据进行分析、集成、处
XML与面向Web的数据挖掘技术
来源:互联网 发布日期:2011-08-19 09:57:06 浏览:12554次
导读: 面向Web的数据挖掘 Web上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应...
上一篇:用 WEKA 进行数据挖掘
相关内容
AiLab云推荐
最新资讯
本月热点
热门排行
-
华为5G-A实现规模组网,下载速度超过4Gbps,比5G快10倍
阅读量:43270
-
最坏时期已过,美国5G市场即将迎来回暖?
阅读量:42651
-
回望2023年5G发展:释放和提升价值成最大课题
阅读量:11947
-
全球吹响5G-A商用号角
阅读量:10817
-
5.5G在欧洲突破,DNA首次将5.5G技术引入现网
阅读量:9844
-
首发新款麒麟5G芯片!曝华为nova 12系列12月26日登场
阅读量:9521
推荐内容
- 2024第83届中国教育装备展示会 CEEIA
- 第二十一届丝路(西安)绿色建筑产业博览会 2024丝路绿色建筑产业(西安)发展大会
- 2024江苏南京国际大健康产业展会(ITS ASIA)
- 第四届中国(临沂)绿色建筑建材产业博览会
- 2024第十八届中部武汉农牧业机械博览会暨农机团购节
- 2024第十届河北任丘厨房、卫浴及配件展览会
- 中国(青岛)畜牧业博览会
- 第二届上海国际碳中和科技展览会
- 2024北京国际面辅料及纱线展览会
- 2024年第十届中国国际建筑涂料及涂装设备展览会
- 2024中国(北京)国际石膏与固废技术及装备展览会
- 2024第十八届中国(北京)保温材料和低碳节能技术展
- 2024中国(江苏)化工装备能源新材料博览会
- 2024中国(东莞)切削工业及工量刃具博览会
- 2024中国(洛阳)工业绿色技术装备博览会
- 2024北京国际校服园服展览会
- 2024中国无锡生物医药产业博览会 中国生物医药科技创新质量大会 中国生物医药人才交流大会
- 2024年第7届越南国际工程机械,矿山机械及运输车辆展
- 2024 中国(无锡)国际气体工业博览会暨第九届国际气体产业大会
- 2024中国(华北)分析测试与实验室装备展览会
- 2024年德国杜塞尔多夫国际管材、线缆及线材展览会