• 您的位置:首頁 > PPT課件 > 行業PPT模版 > 基于云計算的數據挖掘ppt課件

    基于云計算的數據挖掘ppt課件

    素材編號:
    499085
    素材軟件:
    PowerPoint
    素材格式:
    ZIP/RAR
    素材上傳:
    weishenhe
    上傳時間:
    2022-10-02
    素材大。
    1.58 MB
    素材類別:
    行業PPT模版
    網友評分:

    素材預覽

    基于云計算的數據挖掘ppt課件

    基于云計算的數據挖掘ppt課件下載是由PPT寶藏(www.revor-indonesia.com)會員weishenhe上傳推薦的行業PPT模版, 更新時間為2022-10-02,素材編號499085。

    這是基于云計算的數據挖掘ppt課件下載,包括了前言,基于云計算的數據挖掘策略,數據挖掘平臺云架構,基于云計算數據挖掘的關鍵技術,K-means 算法,樸素貝葉斯算法等內容,隨著云計算時代的到來,傳統數據挖掘系統在海量數據的分析挖掘方面存在性能瓶頸;谠朴嬎愕臄祿诰蚱脚_,該平臺與傳統的數據挖掘系統架構相比有高可擴展性、海量數據處理能力、面向服務、硬件成本低廉等優越性,可以支持大范圍分布式數據挖掘的設計和應用。歡迎點擊下載基于云計算的數據挖掘ppt課件。

      基于云計算的數據挖掘

      學生:孫越

      基于云計算的數據挖掘

      前言基于云計算的數據挖掘策略數據挖掘平臺云架構基于云計算數據挖掘的關鍵技術K-means算法樸素貝葉斯算法

      前言

      隨著云計算時代的到來,傳統數據挖掘系統在海量數據的分析挖掘方面存在性能瓶頸;谠朴嬎愕臄祿诰蚱脚_,該平臺與傳統的數據挖掘系統架構相比有高可擴展性、海量數據處理能力、面向服務、硬件成本低廉等優越性,可以支持范圍分布式數據挖掘的設計和應用。

      云計算

      云計算具有的特點?(1)虛擬化(2)通用性(3)高可擴展性及超規模(4)可靠性高(5)經濟性好

      數據挖掘:數據挖掘是一個從量的、不完全的、有噪聲的、模糊的、隨機的實際數據中提取隱含在其中的但具有潛在實用信息和知識的過程。

      數據挖掘的意義:海量數據本身具有噪聲、異構、算法復雜、技術復雜等問題,而現在的云計算開發平臺并沒有提供數據規約等功能。

      數據挖掘步驟

      數據挖掘云架構

      云計算支撐平臺層

      數據挖掘云服務層

      數據挖掘能力層

      傳統的數據挖掘技術在云時代的海量數據中的不足?

      (1)挖掘效率,傳統的基于單機的挖掘算法或基于數據庫、數據倉庫的挖掘技術及并行挖掘已經很難高效地完成海量數據的分析;

      (2)高昂的軟硬件成本也阻止了云時代數據挖掘系統的發展;

      (3)傳統的體系架構不能完成挖掘算法能力的提供,基本是在以單個算法為整體模塊,用戶只能使用已有的算法或重新編寫算法完成自己特的業務。

      第三,云計算的數據挖掘開發方便。

      基于云計算的數據挖掘的優勢

      第一,數據挖掘處理的數據是海量的,云計算可方便的進行規模的數據挖掘。

      第二,成本低。

      基于云計算數據挖掘面臨的問題和挑戰

      2)不確定性。

      1)基于云計算數據挖掘算法的并行性存在一些挑戰。

      3)數據挖掘的方法和結果具有不確定性。

      4)挖掘結果的評價也是不確定的。

      5)軟件、服務可信方面的問題與挑戰。

      K-means算法的基本思想是初始隨機給定K個簇中心,按照最鄰近原則把待分類樣本點分到各個簇。然后按平均法重新計算各個簇的質心,從而確定新的簇心。一直迭代,直到簇心的移動距離小于某個給定的值。

      K-means算法

      K-means算法步驟

      K-means算法流程圖

      (a)

      下面幾幅圖展示了對n個樣本點進行K-means聚類的效果的實例,這里k取2

      (b)

      (c)

      (d)

      (e)

      (f)

      E是數據集中所有對象的平方誤差和p是空間中的點,表示給定的對象是簇的均值

      定義為:

      貝葉斯算法處理流程

      樸素貝葉斯算法

      貝葉斯定理:假設訓練樣本集共分為k類,記為C={,,…,};每個類的先驗概率記P(),i=1,2,…,k,則

      新樣本d屬于類的條件概率為記為P(d|),則

      (1)

      (2)

      根據貝葉斯定理,的后驗概率如公式(3):P(|d)=

      取后驗概率最高的類別作為樣本d所屬類別,設樣本d最可能的類標記為c(d),由于P(d)為一個不依賴于的常量,故去掉P(d)可得到c(x)為:(4)

      (3)

      謝謝!

    上一頁:云計算與物聯網ppt課件 下一頁:分布式系統存儲數據庫云計算ppt課件

    基于云計算的數據挖掘ppt課件

    下載地址

    基于云計算的數據挖掘ppt課件

    優秀PPT

    Copyright:2009-2019 pptbz.com Corporation,All Rights Reserved PPT寶藏 版權所有

    免責聲明:本網站內容由用戶自行上傳,如權利人發現存在誤傳其他作品情形,請及時與本站聯系

    PPT模板下載 粵ICP備13028522號

    舉報 肉体暴力强奷在线播放性的暴形