0

0

SQL Server 2008商务智能方面的功能优化

php中文网

php中文网

发布时间:2016-06-07 17:53:43

|

934人浏览过

|

来源于php中文网

原创

在SQL Server 2008数据库中,对这商务智能方面的功能做了很大的优化。笔者结合相关的案例来谈谈这些优化,希望对各位数据库工程师有所帮助。 商务智能被某些专家宣传的优点神乎其技。其实商务智能并没有那么复杂,在我们身边有很多类似的案例。如就拿SQL Ser

    在SQL Server 2008中,对这商务智能方面的功能做了很大的优化。笔者结合相关的案例来谈谈这些优化,希望对各位工程师有所帮助。

  商务智能被某些专家宣传的优点神乎其技。其实商务智能并没有那么复杂,在我们身边有很多类似的案例。如就拿SQL Server 数据库来说,数据挖掘功能就是商务智能的最好体现。根据相关的数据,对其按照一定的模型与算法进行分析,最后得出一个结果或者决策。这就是商务智能。

  优化一:完善了时序算法的内容。

  对于数据挖掘所需要的数据,可以分为两大类,分别为连续性的数据与非连续性的数据。数据类型不同,需要采用不同的算法与数据挖掘模型,只有如此最后得到的结构误差才会最小。而时序算法,就是针对连续数据进行预测分析的回归算法。时序算法仅仅根据用于创建这个模型的原始数据集就可以做出相关的趋势预测。当然,提供的信息越详细,最后的预测结果准确率也会随之上升。用户在进行预测时还可以向模型中添加更多的数据,以获得更小的误差。在实际工作中,这个算法进程使用。如需要根据以前的销售数据,来预测一下下一年各个地区的销售额或者一年四季每个季度的销售趋势,都需要用到这个算法。

  在2008版本之前,时序算法中没有采用ARTxp自动回归树算法。为此在使用时序算法与模型来对长期的趋势进行预测时,误差会比较大。也就是说,这之前的时序算法比较适合用来进行短期的趋势预测。为了完善时序模型与算法中某些预测的准确性和稳定性,在2008的数据库商务智能中加入了这个ARTxp自动回归树算法。通过这个算法,时序模型可以实现一些针对比较长期的趋势预测,并且达到比较高的精确度。

  在实际工作中,如果要采用时序算法来进行长期趋势预测的话,为了提高最大的准确率,笔者建议两种算法都做一下。即利用ARTxp自动回归树算法和使用ARTMA算法各自计算一次。此时数据库会提供两种不同的结果。虽然数据相同,采用的算法不同最后的结果也是不同的。最后通过数据挖掘模型来评估这两种计算方法得出的结果。在数据分析专家眼中,有时候他们关注的可能并不是最后的结过,而是关系为什么会造成这个差异。通过对差异的分析,找到相关的原因。然后在后续的工作中,积极消除这些因素,使得后续的发展趋势符合预先的规划。

  在2008的时序模型中还对这两种算法的结果进行了组合。如可以通过加权的方式最终根据权数来得到一个加权的结果。如果用户有信心的话,当然也可以选择只采用一种算法,以提高数据分析的效率。不过在大部分情况下,用户还是会选择两种算法独立的计算,以得到一个可以比较的结果。具体选择那种算法,还是需要根据用户的用户来定。如需要考虑预测时期的长短、数据的多少、预测的业务等等情况进行确定。

  优化二:通过刷选器来帮助用户选择恰当的数据挖掘模型。

  在SQL Server 数据库中设计了很多的数据挖掘模型,如决策树模型、线性回归模型、神经网络模型、逻辑回归模型等等。相同的数据,采用了不同的模型,最后得到的结果会有很大的差异。为了提高商务智能的准确性,在对历史数据进行挖掘时,用户需要根据数据的特征、业务的类型等情况选择恰当的数据挖掘模型。只有如此,用户最终才能够得到使用价值比较高的结果。否则的话,反而可能会给用户一个误导。但是,这对用户的要求比较高。如果用户没有丰富的工作经验与理论知识,那么他是很难有这个能力来判断采用哪个模型。这也在很大程度上限制了数据挖掘功能的应用。

magento(麦进斗)
magento(麦进斗)

Magento是一套专业开源的PHP电子商务系统。Magento设计得非常灵活,具有模块化架构体系和丰富的功能。易于与第三方应用系统无缝集成。Magento开源网店系统的特点主要分以下几大类,网站管理促销和工具国际化支持SEO搜索引擎优化结账方式运输快递支付方式客户服务用户帐户目录管理目录浏览产品展示分析和报表Magento 1.6 主要包含以下新特性:•持久性购物 - 为不同的

下载

  在2008数据库版本中,这种对员工经验的依赖情况有所改善。因为在这个版本中,数据库提供了一个挖掘模型的刷选器。这就好像是一个向导工具。在向导中,用户可以输入数据的特征、要预测的业务等内容,然后向导工具在根据用户这些输入的内容,推荐用户采用哪个模型来挖掘数据。这些傻瓜式的操作,可以在最大程度上避免因为用户经验的不足而错误的采用了不恰当的数据挖掘模型。总而言之,通过使用数据挖掘模型刷选器,可以控制用户给模型定型的数据,可以更加容易的帮助用户判断模型的适用性。从而避免采用了不恰当的数据挖掘模型而产生的错误结果。

  另外刷选器还可以对数据进行刷选。如现在用户有一份客户信息,里面有所有客户的消费习惯等等。现在企业准备推出一个专门针对女性的服务或者产品。现在需要根据历史数据来预测一下这个产品或者服务的销售情况。此时就需要对原有的数据进行刷选。在以前,必需先对基础数据进行刷选。不过有了刷选器之后,就不需要这么麻烦了。可以在使用数据挖掘模型的时候,直接利用刷选器对于基础数据进行刷选,过滤男性客户的纪录信息。这不仅可以提高数据挖掘结果的准确性,而且还可以提高数据分析的效率。

  优化三:支持多个挖掘模型的交叉验证。

  在数据挖掘中有一个基础两个核心。基础就是数据,而核心则是挖掘模型与数据挖掘算法。在商务智能中,只有通过这三方面的共同作用,才能够得出正确的结果。在以前的版本中,由于采用的挖掘模型不同,最后产生的结果会相差很大,有时候甚至风马牛不相及。如在SQL Server 数据中,提供了聚类分析模型、决策树模型、逻辑回归模型、顺序分析和聚类分析模型等等数据挖掘模型。即使这些模型采用的数据与计算方法相同,最后得出的结果很有可能都是不同的。为了提高数据挖掘的准确性,在2008中对此进行了优化。主要是提供了多个数据挖掘模型交叉验证的方法,来提高结果与决策的准确性。

  多个数据挖掘模型之间的交叉验证是用于评估数据挖掘模型准确性的常用方法之一。在这交叉验证中,数据库工程师可以将挖掘结果分为若干个子集。然后利用这些子集的数据生成对应的子集模型。最后通过衡量每个分区的模型的准确性来判断某个数据挖掘模型是否准确。通过对最后返回的统计信息的分析,可以判断这个挖掘模型的可靠程度,或者说用户所采用的数据挖掘模型是否适用。而且在交叉验证中,用户还可以选择几个相同结构的模型进行对比,以发现相同结构不同模型之间结果的差异。有时候最终的结果可能没有多大的价值,但是中间的分析过程或者结果之间的差异往往会给企业带来意外的收获。如在实际工作中,可以查找差异的原因,从而找到影响某个结果或者决策的关键因素。

  在SQL Server 2008数据库版本中,用户可以在两个地方调用这个交叉验证。一是在数据挖掘设计器向导中,可以在“挖掘准确性图表”视图中调用交叉验证;二是通过数据分析存储过程来对挖掘结构分区,调用交叉验证。最后数据库可以根据用户的需要,生成相关的交叉验证报表。在这个报表中,会反映各种可能性以及对应的均方根误差。如果采用聚合模型的话,还会有聚合模型的所有度量值的平均偏差和标准偏差等相关的统计信息。

  不过这里需要注意的是,即使采用再复杂的交叉验证模型,也不能够保证最后结构与事实相符。这也是到目前为止商务智能的一个局限性。最后通过数据挖掘所得到的结果,还是要跟用户的相关工作经验进行结合进行判断、甄别决策的准确性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

2

2026.01.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

446

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

145

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

258

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

9

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

13

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

10

2026.01.28

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

25

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

124

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
SQL 教程
SQL 教程

共61课时 | 3.6万人学习

SQL优化与排查(MySQL版)
SQL优化与排查(MySQL版)

共26课时 | 2.3万人学习

MySQL索引优化解决方案
MySQL索引优化解决方案

共23课时 | 2.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号