Identi.ca
Login
KANZAKI, Masahide
at
2017-07-07T15:08:38Z
hOCR - OCR Workflow and Output embedded in HTML
http://kba.github.io/hocr-spec/1.2/
OCRで解析した転写テキストをHTML化し、bbbox、baselineといった情報をtitle属性に記述するという仕様。IIIFのSearch API対応データを生成する元になっているのか。他にはMETS-ALTOというXMLも
https://www.loc.gov/standards/alto/