王權
數據是對客觀事實的測量和記錄,但是有些客觀事實是看不見、摸不著的。患生于所忽,禍起于細微,如果一個投資模型不能涵蓋最全面的數據,一個極小的瑕斑也可能導致最終資產配比的偏差。
投資領域的“隱數據”并不是指常見的市盈率、市凈率等財務數據,也不是那種已經被行業充分了解、廣泛交易,甚至可以在短時間內被準確定價的數據,而是那些需要借助AI技術和非線性算法進行抓取的非結構化數據。
北齊的杜弼在《檄梁文》中講到一個典故。原文為“但恐楚國亡猿,禍延林木,城門失火,殃及池魚”。意思是說:楚國國君丟了猿猴,楚國的人去樹林里抓猴子,卻因此毀壞了林木。城門著了火,人們用護城河的水救火,水用完了,魚受牽連而死。
我們無法假定抓猴子需要多長時間,也許猴子就在原地,得來全不費功夫,我們也無法假定人類失火一定會取水滅火,因為或許天降暴雨。任何事物在發展過程中都有規律可循,但也存在難以預測的“變數”,這些“變數”可能會產生巨大的連鎖反應。那么,人類應當如何探求事物背后千絲萬縷的聯系,并做到精準的場景預設與數據采集呢?
再來看看“蝴蝶效應”的威力吧。一只南美洲亞馬遜河流域熱帶雨林中的蝴蝶,偶爾扇動幾下翅膀,可能在兩周后引發美國得克薩斯州的一場龍卷風。
蝴蝶翅膀的運動代表著系統初始狀態的微小變化,但它引發了一系列事件,從而改變了大氣溫度,最終改變了世界另一端的龍卷風路徑。龍卷風又會帶來什么影響呢?海上航運與國際貿易,道瓊斯工業平均指數與納斯達克綜合指數,以及股市暴漲暴跌……這之間的因果關系如何提前獲知,并用數據精確地表達?
大數據計算已經成為影響世界經濟發展的關鍵變量。在耀眼的數據之下,我們欣狂不已,被已然到來的勝利遮蔽了雙眸。由于全球每年幾百萬噸的塑料垃圾流入大海,并物理分解為微塑料后,會通過食物等途徑進入胎兒體內,于是人類想到了使用“可生物降解塑料”替換傳統塑料,這樣每年可以節約全球4%的化石燃料和2.3%的碳排放。那么以生產“可生物降解塑料”為主營業務的企業是否可以歸類到綠色項目范疇呢?答案似乎是顯而易見的。
雖然“可生物降解塑料”由玉米、甘蔗、大豆和廢油脂等原料制成,廢棄后能夠被微生物分解為水、二氧化碳和生物質,重新回歸自然界。但是我們忽略了另外一個事實:如果“可生物降解塑料”沒有得到有效回收和降解,而進入垃圾填埋場,它們在無氧環境下會分解出大量溫室氣體——甲烷。作為全球第二大溫室氣體,甲烷的增溫效應是同等質量的二氧化碳的80倍以上。
更為驚異的是,如果將一次性塑料制品全部替換為可降解塑料,將會消耗全球一半以上的玉米產量,人們往往只會計算塑料替代帶來的碳減排數量,很少會考慮作為全球最主要糧食作物的玉米產量減少對人類社會的影響。糧食銳減將會引發飼料價格增長、貧困饑餓、社會紊亂……
在投資城市基礎設施項目時,投資方自信滿滿地認為資本可以加速當地經濟社會發展的進程,實際上并沒有將投資可能牽扯到的多維數據盡攬彀中。比如人口流動、車況物流、商品銷售、市場價格等一些非線性現象背后的數據表現,項目施工過程中機械設備、道路交通產生的噪聲污染對周邊居民帶來的負外部性影響。
基礎數據始于對真實世界的把握,但是世界的本相是否可在現有條件下被精準度量?我們在談到中國歷史上有多少個皇帝以及對他們的歷史評價時,獲得的一手基礎信息實際上來自于《二十四史》,某種程度上依賴于司馬遷、班固、陳壽等歷朝史官對真實史料掌握的多寡。
秦始皇與漢武帝的記述是否真如史書所載,一個刻薄少恩,一個封禪求仙?“燭影斧聲”與“靖康之恥”的記錄是否對當初的真相進行了深描或淺描?還有多少尚未發掘或束之高閣、隔絕塵世的孤本史冊?看看竹書紀年、清華簡和敦煌文獻……或許可以說,歷史的真相只有部分存在于公開的典籍中,部分封藏于高天厚土中,剩下的再也杳難尋蹤了。
在投資實踐中,盡管投資方通過融資方信息披露和第三方采集,掌握了大量數據,但在璀璨炫目的顯性數據背后還是會有許多潛藏的“隱數據”,即便是在最先進的大數據計算框架內,它們也很難盡顯真容。但是,這些“看不見的數據”往往能夠從一個更加長期的維度上決定著人類社會的低碳之路能走多遠。
破局不僅需要投資理念的迭新升級,更需要投資行業持之不懈加強“算力建設”的堅毅與勇氣。投資方與融資方需要穿越數據的“莽叢荊棘”,找尋遁身其間的“莖芽枝葉”,運用包括數據倉庫技術、人工智能、神經網絡在內的多元工具,將各式各樣的數據串接成“知識圖譜”,并對圖譜中各個網絡節點之間的關聯性進行充分研判,從大量的“數據礦山”中提取與業務關聯性更高、價值更大的“信息金塊”。