中文全文庫 · 來源與品質

按文本質量編排:以最高質量者為主體,缺則以他庫補充。每庫標明來源、授權與品質等級。← 返回音韻閱讀器

⚠️ 品質紀律:本庫只採來源可溯、經校勘的底本。來源不明、未經校勘的語料不入主體(如殆知閣,考察後排除)。任何直接引用,仍須回核一手印本。

編排原則

主體鏈:CBETA(佛典)+ Kanripo(經史子集道)為可引用主體 → 維基文庫補洞 → ctext/Scripta Sinica 作線上終校尺。

一、主體庫(可引用)

範圍品質來源/授權本地
CBETA
中華電子佛典
佛教文獻(大正藏+卍續藏) ★★★★★ 25 年學者校勘・TEI-XML
github.com/cbeta-org/xml-p5・CC BY-SA
✅ 已下 2.5 GB
Kanripo
漢籍リポジトリ
經史子集道(KR1–KR5,共 5292 部) ★★★★ git 版本控制・對齊四部叢刊/四庫・可溯源
github.com/kanripo・CC BY-SA
⏳ 下載中

註:Kanripo 佛部(KR6,4849 部)刻意不下——佛典以更高質量的 CBETA 為主體,避免重複。

二、補充與校勘層

用途品質來源/授權本地
維基文庫 zh 通用古籍補洞(主體未收者) ★★★ 對掃描底本校對
dumps.wikimedia.org・CC BY-SA
待補(~2 GB dump)
ctext
中國哲學書電子化計劃
核心經典終校尺 ★★★★ 校核標準排印本・僅 API 無整包
ctext.org
線上
Scripta Sinica
漢籍電子文獻
最高精度終校尺 ★★★★★ 中研院・已標點精校・不可批量下載
hanchi.ihp.sinica.edu.tw
線上(不可下)

三、考察後排除

規模品質排除理由
殆知閣
daizhige
~16000 種・20 億字 ★★☆ 來源不明、標點未校、無版本溯源,不符本庫質量標準。僅在主體與補充層皆無覆蓋的極冷僻文獻時,作最後查考線索,且須回核可靠底本後方可引用。