KANZAKI, Masahide at 2017-07-07T15:08:38Z

hOCR - OCR Workflow and Output embedded in HTML http://kba.github.io/hocr-spec/1.2/ OCRで解析した転写テキストをHTML化し、bbbox、baselineといった情報をtitle属性に記述するという仕様。IIIFのSearch API対応データを生成する元になっているのか。他にはMETS-ALTOというXMLも https://www.loc.gov/standards/alto/