杭州2020年6月9日 /美通社/ -- Nebula Graph V1.0 于6月9日正式發(fā)布,它采用 shared-nothing 分布式架構,擅長處理千億節(jié)點萬億條邊的海量關聯(lián)數(shù)據(jù)集,從而更好地服務企業(yè)級應用。Nebula Graph 的設計初衷是為了解決企業(yè)應用中海量數(shù)據(jù)的實時處理問題,相比其他解決方案,它可以更快處理更多的數(shù)據(jù)量,這使得 Nebula Graph 成為業(yè)界領先的高性能圖數(shù)據(jù)庫。
Nebula Graph 是一個開源的圖數(shù)據(jù)庫,由杭州歐若數(shù)網(wǎng)科技有限公司(下文簡稱:歐若數(shù)網(wǎng))自主研發(fā)維護。歐若數(shù)網(wǎng)研發(fā)人員來自阿里巴巴、Facebook、華為、IBM 等大廠。
Nebula Graph 優(yōu)勢
Nebula Graph 分布式架構能處理的數(shù)據(jù)量遠大于其他圖數(shù)據(jù)庫。
此外,高可用的分布式架構使它在企業(yè)級應用中具有在線水平擴容、數(shù)據(jù)恢復特性。
除了分布式架構,Nebula Graph 獨創(chuàng)圖查詢語言 -- nGQL。這是一種為圖結構設計的類 SQL 查詢語言,有 SQL 使用背景的工程師可快速上手 nGQL。
同時,Nebula Graph 開發(fā)了一款圖數(shù)據(jù)可視化工具 -- Nebula Graph Studio,具備數(shù)據(jù)導入和圖探索功能,可對數(shù)據(jù)進行實時交互分析,幫助用戶理解圖數(shù)據(jù)結構。
圖數(shù)據(jù)庫市場和應用
在過去的2年時間里,近1.25億美元注入 Nebula Graph 所在的圖數(shù)據(jù)庫行業(yè),資本市場對圖數(shù)據(jù)庫行業(yè)的支持可見一斑。
和 RDBMS 不同,圖數(shù)據(jù)庫不僅存儲數(shù)據(jù)本身,也存儲了數(shù)據(jù)之間的深層關系。因此,圖數(shù)據(jù)庫可高效地管理萬億級別關聯(lián)數(shù)據(jù),挖掘數(shù)據(jù)之間的深層關系,而這恰恰是傳統(tǒng)的關系型數(shù)據(jù)庫(RDBMS)難以解決的問題。
對 CIO 而言,Nebula Graph 是挖掘現(xiàn)存數(shù)據(jù)關聯(lián)關系潛在價值的絕佳選擇。對希望低成本、高效地處理關聯(lián)關系的架構師而言,Nebula Graph 也是一個理想的選擇方案。此外,數(shù)據(jù)科學家也可用 Nebula Graph 深挖數(shù)據(jù)背后的關聯(lián)價值。
現(xiàn)代商業(yè)社會產生了海量數(shù)據(jù),不同的數(shù)據(jù)儲存在不同的地方,容易形成信息孤島。利用 Nebula Graph,企業(yè)可以打通信息孤島,挖掘數(shù)據(jù)中有意義的關聯(lián)信息加以利用。例如,在金融領域,可以利用 Nebula Graph 發(fā)現(xiàn)潛在風險,預防團伙作案的金融欺詐事件;政府有關部門也可用于監(jiān)控線上活動、機構、賬號等,第一時間發(fā)現(xiàn)潛在威脅、應對可疑情況。
除了上述場景,還有許多 Nebula Graph 適用場景。通過 Nebula Graph,社交媒體網(wǎng)可將用戶進行點對點連接,更好地服務于他們;在物聯(lián)網(wǎng)(IoT)領域,只有設備間的關聯(lián)有意義,才能帶來更大的商業(yè)價值;線上零售、醫(yī)療保健領域、人工智能(AI)領域,Nebula Graph 也可助力處理、挖掘關聯(lián)信息。
如何使用 Nebula Graph
目前 Nebula Graph V1.0 已發(fā)布,可基于 Apache 2.0 許可證使用 Nebula Graph。近期 Nebula Graph 將會提供云上服務。
用戶寄語
“之前京東數(shù)科的圖服務是由 JanusGraph 提供的,我們碰到的主要問題是寫入和查詢速度很慢,且社區(qū)不活躍 bug fix 不及時,導致業(yè)務使用體驗不理想。正在尋找新的解決方案時,遇到 Nebula Graph 剛啟動,所以京東數(shù)科圖技術團隊立刻就參與了 Nebula Graph 的開源社區(qū),并一起參與和合作開發(fā)了很多功能。借助 Nebula Graph 圖數(shù)據(jù)庫的高性能分布式存儲和查詢能力,從京東數(shù)科海量數(shù)據(jù)集中挖掘重要的關聯(lián)關系,很好的助力內部和集團業(yè)務的開展。目前,我們正在將更多的圖項目從傳統(tǒng)方案遷移到 NebulaGraph?!?/p>
-- 京東數(shù)科圖技術團隊負責人錢勇
“在接觸 Nebula Graph 之前,我們的圖譜項目已經(jīng)試用過多個知名的開源圖數(shù)據(jù)庫,包括 Neo4j、JanusGraph、DGraph 這些在 DB-Engine 上排名非常靠前的產品,但在規(guī)模和性能上沒法滿足我們的要求,導致項目一直沒有上線。當遇到 Nebula Graph 后,我們發(fā)現(xiàn) Nebula Graph 的架構設計簡潔可擴展,且基于 C++ 開發(fā),性能特別強勁,具備非常強的互聯(lián)網(wǎng)分布式基因;Nebula的同學們也非常給力靠譜,大家一起解決了N多個技術難題,成功把性能提升到遠超最初規(guī)劃,并且基于公司已有基礎設施,搭建了一套圖數(shù)據(jù)庫平臺,方便業(yè)務接入?,F(xiàn)在,我們正在通力合作,把更多的知識圖譜項目遷移到 Nebula Graph 上面來。”
-- 美團點評AI平臺技術專家趙登昌
基于圖的風控和推薦方案相比傳統(tǒng)方案有很大的技術優(yōu)勢,通過圖技術賦予的新能力,我們在業(yè)務上發(fā)現(xiàn)了很多有意思的增長點。但由于業(yè)務上對于低時延、高并發(fā)的要求,我們一直在尋找高性能的開源圖數(shù)據(jù)庫方案。在通過詳盡的比較 Nebula Graph、Neo4j、DGraph、JanusGraph 幾種開源方案后,我們最終選用了 Nebula Graph,是基于這樣幾個原因:
-- 有贊數(shù)據(jù)基礎平臺技術專家陳琦
“基于企業(yè)間關系的企業(yè)圖譜、供應鏈關系、企業(yè)知識圖譜這些應用都是非常典型的知識圖譜應用,也非常適合使用圖數(shù)據(jù)庫來作為基礎設施支撐業(yè)務發(fā)展。最初階段,我們使用了某知名單機圖數(shù)據(jù)庫的方案,很好的支持了彼時業(yè)務的快速擴張;但隨著互聯(lián)網(wǎng)式的數(shù)據(jù)量和訪問規(guī)??焖僭黾?,這樣的方案在擴展性和時效性上的問題越來越突出。在得知 Nebula Graph 去年5月份開源后,我們就一直持續(xù)關注其動態(tài),其分布式架構很適合我們的業(yè)務需求,并且迭代速度相當快速。在經(jīng)過幾個月的試用和調優(yōu)后,Nebula Graph 已經(jīng)在相當多內部業(yè)務上替代了原方案;未來,隨著對于 OpenCypher 的兼容,我們計劃將更多業(yè)務遷移到 Nebula Graph上?!?/p>
-- 蘇州朗動網(wǎng)絡技術有限公司(企查查)知識圖譜算法專家鄭文裕
“I have a graph,a red graph. 小紅書作為一個在線社區(qū),有著很多的圖存在:用戶和筆記的交互關系,用戶和用戶的關注關系,電商交易關系等等。關系型數(shù)據(jù)庫往往不能有效支撐小紅書這樣一個量級的圖有效存儲和實時查詢計算。筆者接觸過不少圖數(shù)據(jù)庫,一些寄希望于摩爾定律的發(fā)展,其他在性能上達不到我們的要求。我們選用Nebula圖數(shù)據(jù)庫,首先來自對團隊的信任,創(chuàng)始人和核心成員在Facebook和螞蟻金服,阿里等大公司做過圖數(shù)據(jù)庫,支撐了在線業(yè)務數(shù)據(jù)流下的推薦、搜索和風控等多個場景,深刻理解數(shù)據(jù)和業(yè)務形態(tài)以及之上的算法場景和需求,是最熟悉中國一線互聯(lián)網(wǎng)公司圖數(shù)據(jù)庫需求的團隊。其次諸多核心架構設計保證了對于超大規(guī)模數(shù)據(jù)的支持和集群規(guī)模的可擴展性。值得一提的是,對于圖上經(jīng)典的熱點問題,Nebula最早應小紅書需求實現(xiàn)了蓄水池抽樣算法。我們也利用Nebula這個風控底層武器來保護小紅書社區(qū)這個Red Graph,同時也在賦能給我們的其它業(yè)務算法線。”
-- 小紅書反作弊風控策略算法負責人吹雪