自己在關注研究的領域有 2 個,一個是區塊鏈,一個是人工智能。說實話,chatGPT 的出現比預想中要快很多,也許以後某一天回想起來,今年真的是非常特別的一年。
一些流行的產物#
一些自己的體驗#
最近自己一直在使用 chatGPT 的新模型,愈發覺得這會是一個划時代的產品。它使得個體不再強依賴於專業知識的桎梏,創造力得以進一步釋放。
以我自己為例,最近在學習 Python 爬蟲,想著爬一下自己部落格的所有文章,最後輸出一個表格。放在以前,我要去思考用什麼樣的方式來實現,以及自己去多測試一下。而現在,只需要將自己的需求以自然語言告訴 GPT,它會返回一個邏輯結構沒有問題的程式碼,而我只需要做的是改一改其中的參數,更符合我的實際需求。
貼一下 GPT 4 幫我生成的 Python 爬蟲程式碼,我僅僅對其中的 find () 方法做了小的調整,改了 class 屬性,這個效率是驚人的。
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 定義目標網址
base_url = 'http://chiloh.cn'
page_url = '/page/'
# 發起請求並獲取總頁數
response = requests.get(base_url)
soup = BeautifulSoup(response.text, 'html.parser')
last_page = int(soup.find('ol', class_='page-navigator').find_all('a')[-2].text.strip())
# 創建一個空的列表,用於存儲每篇文章的標題、鏈接和發布時間
data = []
# 遍歷所有分頁頁面
for i in range(1, last_page + 1):
url = base_url + page_url + str(i)
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有文章的標題、鏈接和發布時間
articles = soup.find_all('article', class_='post')
# 遍歷所有文章,提取標題、鏈接和發布時間,並添加到data列表中
for article in articles:
title = article.find('h2', class_='post-title').text.strip()
link = article.find('a', href=True)['href']
date = article.find('date', class_='post-meta').text.strip()
data.append([title, link, date])
# 將data列表轉換為pandas的DataFrame格式
df = pd.DataFrame(data, columns=['標題', '鏈接', '發布時間'])
# 將DataFrame保存為名為typecho的表格文件
df.to_csv('typecho.csv', index=False)
一些自己的感受#
在公司日報裡,自己寫了下面的感受分享。其實還有一些與產品相關的設想,由於比較敏感就刪除掉了。大體的意思是 ok 的,這是近半年來自己的一些體驗與想法。
AI 比預想中要來得更快一些,回過頭來看,許多之前湧現的產品更像是水暖之前的鴨子。AI 像是人類智慧的孩子,無限逼近我們說的本體,但它又不是本體,它可以是 Everything。
對它的認識,與之前體驗許多產品後,結合自己的思考,在產品上想實現的探索是吻合的:
信息傳遞障礙減弱
人類對話式的 prompt 交互方式,極大程度降低了輸入與輸出的難度,個體不再受限於專業知識的桎梏,創造力得以進一步釋放。狹義上的超級個體一定會越來越多湧現,表達的空間是一個肉眼可見的增長區間。
信息流通速度加快
多模態的 model 讓信息形態不再那麼重要,就像很久之前設想的那樣:信息可以是固態,液態,甚至是氣態。而現在信息可以是文字,是圖片,是音頻,是視頻。
這意味著,也許會出現一種 Flow 的新事物,它會在不同的應用,不同的角色之間流轉,在一款應用裡是文字,在另一款應用裡也許是視頻,但它們本質要傳遞的是同一份序列信息。
而跨模態的信息,在流通時將會是一個天然的 Flow,它可以流動到任何形狀裡,變成想要的模樣。
信息質量損耗與還原
信息形態的變換,在不同時空下,註定會有一些損耗。從視頻變成文字,會損失圖像,就像我們開會要看到攝像頭一樣,這部分就是損失的信息。而逆向思考,我們在做的是盡可能去還原信息的本體。
就像線上開會一樣,損失了線下大家互相看見的部分,所以有許多會議軟件會做攝像頭,會做增強眼神對話,會做降噪處理,本質上都是在還原時空下的信息全貌。
在不同的時空下,不同信息的損耗是不同的,這意味著各種各樣的信息供給。需要以一種自由的方式去自定義如何提供給下一個時空場景。不同的場景和角色對於信息的需求是不同的,在還原信息全貌的過程中,更像是從這些供給當中選擇更加重要的部分,去盡力在這個 “場” 下來還原。
將信息在不同時空的流通看作是一種 “死亡”,AGI 的生成能力在做的是 “創造與新生”。某些信息在上一個時空裡死了,但下一個時空裡會新生一些出來