NLP自然語言處理討論版
奔跑在 NLP 馬拉松時,有沒有想不透的問題需要尋求協助?快來這裡與其他夥伴們互相分享以及詢問專家如何解題~(只要與論壇主題相符均可自由交流)
貼文
-
法律科技黑客松 2021
法律科技黑客松將邀請跨領域的參賽者們合作組隊,以資訊技術應用於法律、法規等資料,一起深入探討並提案,...
-
讓 Python 爬蟲也能讀得懂「滑動驗證碼」
「滑動驗證碼(Slider Captcha)」是驗證碼機制當中常見的典型,也是防範 #爬蟲程式 中一...
-
Python 爬蟲的工具鍊 | 資料科學家的工作日常
WeiYuan Note | Python 爬蟲的工具鍊
-
資料科學家、分析師、工程師差在哪?一文搞懂你的資料團隊需要哪些人|經理人
有資料分析師還需要科學家?工程師又要做什麼?玩轉資料的路上,你需要的不是一個超級強者,而是一支合作無...
-
有了模型然後呢?從資料模型到數據產品
傳統的資料科學工作流程通常只考慮到「#產出模型」為止,著重的是如何訓練一個「好」的模型與「嚴謹」的解...
-
資料科學是什麼?一句話解釋給你聽
資料科學是什麼? 根據維基百科中的定義:「資料科學(Data Science)又稱為數據科學,是一...
-
Google發表新NLP預訓練模型Switch Transformer
Google Brain利用稀疏技術和多專家模型(MoE),打造出1.6兆參數的NLP預訓練模型Sw...
-
【AI專案的開始:該怎麼選數據特徵和演算法?】
過往在抓數據特徵時,通常會參考該領域專家的經驗及知識,但人類的認知較主觀,100筆AI數據中,專家所...
-
迎戰未來AI熱潮 嚴成文教授:強化學習與GNN成關鍵
智慧語音助理、推薦系統、人臉辨識等等,人工智慧(AI)已大舉進入我們的日常生活,人工智慧技術應用進步...
-
Peggy的實驗空間: 學習筆記|Machine learning DevOps的五個關鍵思考點
因為近幾年手頭上的專案多和machine learning 相關 , 最近趁著過年期間,沈澱思緒...
-
Python 爬蟲的工具鍊
Introduction資料爬蟲是資料分析的入門磚,Python 更是資料爬蟲的熱門工具。因為熱門,...
-
如何讓 Big Data 發揮商業價值
Introduction巨量資料是這幾年很熱門的議題,從企業到政府單位都高喊資料經濟。但很多人都在問...
-
如何找出特定領域關鍵字-Chi Square, Lift 介紹
1.使用Chi Square χ2 常用在類別檢定。假設每一篇文章都當成是「一類」,若「馬英九」一詞...
-
请注意 注意力 - 自然语言处理注意力机制 【莫烦Python】 - YouTube
在注意力之上的注意力长什么样?从生物学的角度来理解机器学习(自然语言处理NLP)中的注意力机制。 "...
-
觀察資料的 N 件事
資料科學是以知識探索為目的的一種方法,如何將資料一層一層挖掘出有價值的知識。搭配電腦科學的角度來看,...
-
如何定義一個「資料」專案?
資料科學是以知識探索為目的的一種方法,如何將資料一層一層挖掘出有價值的知識。搭配電腦科學的角度來看,...
-
NLP 繁體中文斷詞的霸主 —— CKIP - Clay-Technology World
中研院的繁體中文斷詞系統 CKIP 終於開源在 Github 上了,名稱就叫做 ckiptagger...
-
華為開源預訓練语言模型「哪吒」:編碼、掩碼升级,提升多項中文 NLP 任務效果! (附 tinyBert 開源連結)
https://www.leiphone.com/news/201912/YmSMHZUOCekn9...
-
BERT, RoBERTa, DistilBERT, XLNet 的用法對比
下面這篇文章, 講到 Bert 一系的進展我們在 Kaggle 上看到的寫法, 不是 Bert, 而...