1. 關系模式的分析演算法的准則有哪些
關系模式分解的目的是解決數據冗餘的問題,但要考慮多方面的問題。如原關系模式中信息是否丟失,函數依賴關系是否保持等,要研究這方面的問題就要涉及關系模式分解演算法的具體准則。
關系模式的分解演算法中有以下幾方面的准則:((1)若要求分解具有無損連接性,則模式分解一定可以達到第四範式(4NF)。
(2)若要求分解保持函數依賴性,則模式分解可以達到第三範式(3NF),但不一定能達到巴斯−科德範式(BCNF)。
(3)若要求分解既具有無損連接性,又保持函數依賴性,則模式分解可以達到第三範式(3NF),但不一定能達到巴斯−科德範式(BCNF)。
1.二元分解的無損連接性判斷二元分解是關系模式分解中最簡單的一種分解方式。二元分解是將原關系模式分解成兩個子關系模式。如將關系模式R分解成關系模式集ρ,ρ中包含兩個關模式R1、R2,即ρ={R1,R2},則ρ是R的二元分解。
當關系模式分解是最簡單的二元分解(ρ={R1
2. 貝葉斯演算法
貝葉斯演算法是統計學的一種分類方法,它是一類利用概率統計知識進行分類的演算法。
在許多場合,樸素貝葉斯分類演算法可以與決策樹和神經網路分類演算法相媲美,該演算法能運用到大型資料庫中,而且方法簡單、分類准確率高、速度快。
通常,用虛線代表NB所需的邊,用實線代表新增的邊。屬性Ai與Aj之間的邊意味著屬性Ai對類別變數C的影響還取決於屬性Aj的取值。這些增加的邊需滿足下列條件:類別變數沒有雙親結點,每個屬性有一個類別變數雙親結點和最多另外一個屬性作為其雙親結點。
由於在TAN演算法中考慮了n個屬性中(n-1)個兩兩屬性之間的關聯性,該演算法對屬性之間獨立性的假設有了一定程度的降低,但是屬性之間可能存在更多其它的關聯性仍沒有考慮,因此其適用范圍仍然受到限制。