大數據的結構
大數據包括結構化、半結構化和非結構化數據,非結構化數據越來(lái)越成為數據的主要部分。據IDC的調查報告顯示:企業(yè)中80%的數據都是非結構化數據,這些數據每年都按指數增長(cháng)60%。大數據就是互聯(lián)網(wǎng)發(fā)展到現今階段的一種表象或特征而已,沒(méi)有必要神話(huà)它或對它保持敬畏之心,在以云計算為代表的技術(shù)創(chuàng )新大幕的襯托下,這些原本看起來(lái)很難收集和使用的數據開(kāi)始容易被利用起來(lái)了,通過(guò)各行各業(yè)的不斷創(chuàng )新,大數據會(huì )逐步為人類(lèi)創(chuàng )造更多的價(jià)值。
特征
容量(Volume):數據的大小決定所考慮的數據的價(jià)值和潛在的信息;
種類(lèi)(Variety):數據類(lèi)型的多樣性;
速度(Velocity):指獲得數據的速度;
可變性(Variability):妨礙了處理和有效地管理數據的過(guò)程。
真實(shí)性(Veracity):數據的質(zhì)量
復雜性(Complexity):數據量巨大,來(lái)源多渠道
價(jià)值(value):合理運用大數據,以低成本創(chuàng )造高價(jià)值