淺談人工智能

自己在關注研究的領域有 2 個，一個是區塊鏈，一個是人工智能。說實話，chatGPT 的出現比預想中要快很多，也許以後某一天回想起來，今年真的是非常特別的一年。

一些流行的產物#

一些自己的體驗#

最近自己一直在使用 chatGPT 的新模型，愈發覺得這會是一個划時代的產品。它使得個體不再強依賴於專業知識的桎梏，創造力得以進一步釋放。

以我自己為例，最近在學習 Python 爬蟲，想著爬一下自己部落格的所有文章，最後輸出一個表格。放在以前，我要去思考用什麼樣的方式來實現，以及自己去多測試一下。而現在，只需要將自己的需求以自然語言告訴 GPT，它會返回一個邏輯結構沒有問題的程式碼，而我只需要做的是改一改其中的參數，更符合我的實際需求。

貼一下 GPT 4 幫我生成的 Python 爬蟲程式碼，我僅僅對其中的 find () 方法做了小的調整，改了 class 屬性，這個效率是驚人的。

import requests
from bs4 import BeautifulSoup
import pandas as pd

# 定義目標網址
base_url = 'http://chiloh.cn'
page_url = '/page/'

# 發起請求並獲取總頁數
response = requests.get(base_url)
soup = BeautifulSoup(response.text, 'html.parser')
last_page = int(soup.find('ol', class_='page-navigator').find_all('a')[-2].text.strip())

# 創建一個空的列表，用於存儲每篇文章的標題、鏈接和發布時間
data = []

# 遍歷所有分頁頁面
for i in range(1, last_page + 1):
    url = base_url + page_url + str(i)
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')

    # 找到所有文章的標題、鏈接和發布時間
    articles = soup.find_all('article', class_='post')

    # 遍歷所有文章，提取標題、鏈接和發布時間，並添加到data列表中
    for article in articles:
        title = article.find('h2', class_='post-title').text.strip()
        link = article.find('a', href=True)['href']
        date = article.find('date', class_='post-meta').text.strip()
        data.append([title, link, date])

# 將data列表轉換為pandas的DataFrame格式
df = pd.DataFrame(data, columns=['標題', '鏈接', '發布時間'])

# 將DataFrame保存為名為typecho的表格文件
df.to_csv('typecho.csv', index=False)

一些自己的感受#

在公司日報裡，自己寫了下面的感受分享。其實還有一些與產品相關的設想，由於比較敏感就刪除掉了。大體的意思是 ok 的，這是近半年來自己的一些體驗與想法。

AI 比預想中要來得更快一些，回過頭來看，許多之前湧現的產品更像是水暖之前的鴨子。AI 像是人類智慧的孩子，無限逼近我們說的本體，但它又不是本體，它可以是 Everything。

對它的認識，與之前體驗許多產品後，結合自己的思考，在產品上想實現的探索是吻合的：

信息傳遞障礙減弱

人類對話式的 prompt 交互方式，極大程度降低了輸入與輸出的難度，個體不再受限於專業知識的桎梏，創造力得以進一步釋放。狹義上的超級個體一定會越來越多湧現，表達的空間是一個肉眼可見的增長區間。

信息流通速度加快

多模態的 model 讓信息形態不再那麼重要，就像很久之前設想的那樣：信息可以是固態，液態，甚至是氣態。而現在信息可以是文字，是圖片，是音頻，是視頻。

這意味著，也許會出現一種 Flow 的新事物，它會在不同的應用，不同的角色之間流轉，在一款應用裡是文字，在另一款應用裡也許是視頻，但它們本質要傳遞的是同一份序列信息。

而跨模態的信息，在流通時將會是一個天然的 Flow，它可以流動到任何形狀裡，變成想要的模樣。

信息質量損耗與還原

信息形態的變換，在不同時空下，註定會有一些損耗。從視頻變成文字，會損失圖像，就像我們開會要看到攝像頭一樣，這部分就是損失的信息。而逆向思考，我們在做的是盡可能去還原信息的本體。

就像線上開會一樣，損失了線下大家互相看見的部分，所以有許多會議軟件會做攝像頭，會做增強眼神對話，會做降噪處理，本質上都是在還原時空下的信息全貌。

在不同的時空下，不同信息的損耗是不同的，這意味著各種各樣的信息供給。需要以一種自由的方式去自定義如何提供給下一個時空場景。不同的場景和角色對於信息的需求是不同的，在還原信息全貌的過程中，更像是從這些供給當中選擇更加重要的部分，去盡力在這個 “場” 下來還原。

將信息在不同時空的流通看作是一種 “死亡”，AGI 的生成能力在做的是 “創造與新生”。某些信息在上一個時空裡死了，但下一個時空裡會新生一些出來