大數據分析 - MBA智库百科
文章推薦指數: 80 %
大數據分析的方法
大數據分析
用手机看条目
扫一扫,手机看条目
出自MBA智库百科(https://wiki.mbalib.com/)
大數據分析(LargeDataAnalysis)
目錄
1什麼是大數據分析
2大數據分析的方法
3大數據分析的步驟
4相關條目
[編輯]什麼是大數據分析
大數據分析是指對規模巨大的數據進行分析。
[編輯]大數據分析的方法
1.AnalyticVisualizations(可視化分析)
不管是對數據分析專家還是普通用戶,數據可視化是數據分析工具最基本的要求。
可視化可以直觀的展示數據,讓數據自己說話,讓觀眾聽到結果。
2.DataMiningAlgorithms(數據挖掘演算法)
可視化是給人看的,數據挖掘就是給機器看的。
集群、分割、孤立點分析還有其他的演算法讓我們深入數據內部,挖掘價值。
這些演算法不僅要處理大數據的量,也要處理大數據的速度。
3.PredictiveAnalyticCapabilities(預測性分析能力)
數據挖掘可以讓分析員更好的理解數據,而預測性分析可以讓分析員根據可視化分析和數據挖掘的結果做出一些預測性的判斷。
4.SemanticEngines(語義引擎)
我們知道由於非結構化數據的多樣性帶來了數據分析的新的挑戰,我們需要一系列的工具去解析,提取,分析數據。
語義引擎需要被設計成能夠從“文檔”中智能提取信息。
[2]
5.DataQualityandMasterDataManagement(數據質量和數據管理)
數據質量和數據管理是一些管理方面的最佳實踐。
通過標準化的流程和工具對數據進行處理可以保證一個預先定義好的高質量的分析結果。
[編輯]大數據分析的步驟
統計/分析
統計與分析主要利用分散式資料庫,或者分散式計算集群來對存儲於其內的海量數據進行普通的分析和分類彙總等,以滿足大多數常見的分析需求,在這方面,一些實時性需求會用到EMC的GreenPlum、Oracle的Exadata,以及基MySQL的列式存儲Infobright等,而一些批處理,或者基於半結構化數據的需求可以使用Hadoop。
統計與分析這部分的主要特點和挑戰是分析涉及的數據量大,其對系統資源,特別是I/O會有極大的占用。
導入/預處理
將這些來自前端的數據導入到一個集中的大型分散式資料庫,或者分散式存儲集群,並且可以在導入基礎上做一些簡單的清洗和預處理工作。
也有一些用戶會在導入時使用來自Twitter的Storm來對數據進行流式計算,來滿足部分業務的實時計算需求。
導入與預處理過程的特點和挑戰主要是導入的數據量大,每秒鐘的導入量經常會達到百兆,甚至千兆級別。
挖掘
比較典型演算法有用於聚類的K-Means、用於統計學習的SVM和用於分類的NaiveBayes,主要使用的工具有HadoopMahout。
[編輯]相關條目
大數據
大數據知識服務
取自"https://wiki.mbalib.com/zh-tw/%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90"
本條目對我有幫助20
赏
MBA智库APP
扫一扫,下载MBA智库APP
分享到:
下载MBA智库,阅读全文
温馨提示
复制该内容请前往MBA智库App
立即前往App
如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目或投訴舉報。
本條目相關文檔
數據分析行業與項目數據分析師24頁 數據分析之如何用數據3頁 數據分析30頁 數據分析1頁 數據分析1頁 數據分析25頁 《游戲數據分析的藝術》之游戲數據分析的流程(下)6頁 《游戲數據分析的藝術》之游戲數據分析的流程9頁 《游戲數據分析的藝術》之游戲數據分析的流程(上)6頁 《游戲數據分析的藝術》之游戲數據分析的流程9頁 更多相關文檔
本条目相关课程
本条目由以下用户参与贡献
寒曦,Mis铭,刘维燎. 頁面分類:信息管理術語
評論(共0條)提示:評論內容為網友針對條目"大數據分析"展開的討論,與本站觀點立場無關。
發表評論請文明上網,理性發言並遵守有關規定。
导航
首页
文档
百科
课堂
商学院
资讯
国际MBA
商城
企业服务
個人工具
用戶登錄創建新帳號
打开APP
搜索
全球专业中文经管百科,由121,994位网友共同编写而成,共计432,054个条目
首页
管理
营销
经济
金融
人力资源
咨询
财务
品牌
证券
物流
贸易
商学院
法律
人物
分类索引
查看
條目討論編輯收藏
简体中文繁体中文
工具▼
鏈入頁面
鏈出更改
上載文件 特殊頁面 可列印版
永久链接
導航
最新資訊
最新评论
最新推荐
热门推荐
编辑实验
使用帮助
创建条目
随便看看
INFPISTP(人格特質理論)ENFPINFJ波特五力分析模型成吉思汗INTJ凈資產收益率ISFPGDP
奶頭樂理論蘑菇管理定律猴子管理法則情緒ABC理論100個最流行的管理辭彙垃圾人定律21天效應破窗效應SWOT分析模型墨菲定律
以上内容根据网友推荐自动排序生成
最後更改17:09,2016年10月13日.
智库首页-
百科首页-
关于百科-
客户端-
人才招聘-
广告合作-
权利通知-
联系我们-
免责声明
-友情链接
©2022MBAlib.com,Allrightsreserved.
闽公网安备35020302032707号
问题分类
类型
反馈内容
添加图片(选填)0/9
联系方式
取消
提交
提交成功
反馈结果请前往MBA智库App查看(我的>帮助与反馈>我的反馈)
知道了
延伸文章資訊
- 1大數據分析 - MBA智库百科
大數據分析的方法
- 2大數據分析方法簡介
大數據分析方法簡介 · 1. FAQ. 我們可以用傳統的推論統計和多變量分析方法來做大數據分析嗎? · 2. 大數據的特徵. 資料點數、欄位數都很大 · 3. 預測性模型的商業應用. Googl...
- 3大數據是什麼? 如何應用大數據分析? - 策略顧問公司| OOSGA
且根據麥肯錫預估,大數據分析將會在19個產業當中創造9.5兆~15.4兆美金 ... 能力去執行大數據分析,若業者期望用既有的分析方法來處理大數據,那麼這 ...
- 4大數據分析方法 - 博客來
書名:大數據分析方法,語言:簡體中文,ISBN:9787504764164,頁數:151,出版社:中國物資出版社,作者:陸紅,出版日期:2017/06/01,類別:自然科普與應用科學.
- 5什麼是大數據分析?