KANZAKI, Masahide masaka@identi.ca

Tokyo, Japan

A pure tone enthusiast bass player. maybe a little of semantic web stuff

  • 2019-08-15T07:47:26Z via Identi.ca Web To: Public CC:

    Re: RDF* semantics https://lists.w3.org/Archives/Public/public-rdf-star/2019Aug/0020.html RDF具体化の意味論は抽象的な言明型と具体的な言明の出現(トークン)をきちんと区別しているが中途半端なまま。RDF starのSAモードはほぼ前者でありその略記法でOK、一方PGモードは後者になるが出現コンテクストの識別法がなく、併合他で問題を生じる。さらに別コンテクスト(文書など)から参照する方法がない。提案も含め長文の投稿
  • 2019-08-13T12:31:27Z via Identi.ca Web To: Public CC:

    Re: The Joy of NULLs (not) https://lists.w3.org/Archives/Public/semantic-web/2019Aug/0027.html 「車のナンバープレートにNULLを取得したら、システムのバグでナンバー不明の駐車違反チケットがどっさり送られてきた」という記事をネタにして、RDFなら空白ノードで表現できるだとか、SQLのNULLと空白ノードの違いだとか、楽しそうに議論
  • 2019-08-12T07:56:29Z via Identi.ca Web To: Public CC:

    Re: RDF* semantics https://lists.w3.org/Archives/Public/public-rdf-star/2019Aug/0017.html PatHayesからRDF starのPG/SAモードと具体化(reification)の関係について。SAモードは「言明されていない、あるいは未知の」ことがら=グラフに存在しない=について述べるので、前ポストの例でマッチがないというわけか。いずれにしても、グラフを併合するとこの部分はクラッシュしてしまう
  • 2019-08-06T08:39:52Z via Identi.ca Web To: Public CC:

    RDF* (star) semantics https://lists.w3.org/Archives/Public/public-rdf-star/2019Aug/0001.html PatHayesから具体化の意味論に正しく沿っていないという指摘→プロパティグラフ(PG)モードと分離言明(separate-assertions=SA)モードの2つを考えると。( (:bob, foaf:age, 23), dct:creator, :crawler1 )のRDF*グラフについてクエリSELECT * { :bob foaf:age ?a }を投げたとき、後者はマッチがないという。厄介な話になりそうな
  • 2019-08-05T15:46:11Z via Identi.ca Web To: Public CC:

    T221916 Create RDF export for structured data stored for files https://phabricator.wikimedia.org/T221916 Wikimedia Commons構造化記述のRDFはこちらのタスクに吸収されて、いつのまにか実装されていたという
  • 2019-07-24T09:05:06Z via Identi.ca Web To: Public CC:

    Linked Places format https://github.com/LinkedPasts/linked-places 地名辞典(gazetteer)の共通データフォーマットとして、場所に関する情報を歴史的変遷も含めて記述するというものらしい。GeoJSONとして使えるようにしたJSON-LDということだが、RDFグラフにすると空白ノードだらけ、URIはリテラルというかなり厳しいもの。たぶんWHG2019に関して https://twitter.com/RyanMHorne/status/1152948682729426946 辺りから流れてきたのだと思われるが、どうだったか??
  • 2019-07-21T09:24:57Z via Identi.ca Web To: Public CC:

    Release of ShEx.ex 0.1 https://lists.w3.org/Archives/Public/public-shex/2019Jul/0000.html Elixir上で動くShEx、ShapeMap対応ツール。大規模データの並行処理ができるとのこと
  • 2019-07-21T06:02:56Z via Identi.ca Web To: Public CC:

    Document Content Description for XML https://www.w3.org/TR/NOTE-dcd RDF/Sの歴史語りの中で、XMLのスキーマをRDFで表現する試みとしてdanbriが言及していた、Tim BrayによるDCD案(19980731)。初めて見た
  • 2019-07-21T05:57:08Z via Identi.ca Web To: Public CC:

    Re: Semantic Web archaeology https://lists.w3.org/Archives/Public/semantic-web/2019Jul/0013.html なぜrdf:Seqでrdfs:Seqandじゃないのかという疑問からはじまったスレッドに、danbriがRDF M+SとRDFSの関係など詳しい答え。直前0004でPatHayesが答えている「rdf:はRDF言語の基本機能で、rdfs:は基本的な公理とクラス理論について」というのが分かりやすい区分
  • 2019-07-21T05:24:04Z via Identi.ca Web To: Public CC:

    Trip Report: SIGMOD/PODS 2019 https://wp.me/pm8cF-D5 データベースの国際会議Int'l Conference on Management of Dataのレポート。機械学習とデータ管理の関連に加え、来歴New Provenance Applicationsに注目しているのが興味深い。論文リンク多数
  • 2019-07-14T05:17:53Z via Identi.ca Web To: Public CC:

    AtomGraph/CSV2RDF: Streaming, transforming, SPARQL-based CSV to RDF converter https://github.com/AtomGraph/CSV2RDF CSVWのJSON定義ファイルではなく、SPARQLのCONSTRUCTで変換を定義するというJavaツール。日本語も問題なく扱える
  • 2019-07-14T03:30:08Z via Identi.ca Web To: Public CC:

    syntreenet https://gitlab.com/enriquepablo/syntreenet 生成規則(production rule)を開発するためのPythonライブラリ。cf https://lists.w3.org/Archives/Public/semantic-web/2019Jul/0036.html
  • 2019-07-12T15:11:27Z via Identi.ca Web To: Public CC:

    LilyPond notation - Wikidata https://www.wikidata.org/wiki/Property:P6883 これがプロパティとして定義されていた。使い方に気をつけないと、ラヴェルのSQ1番のLilyPond notationのような記述が出てきて混乱しそう。この場合はSQ1--musical motif-->[motif]--lilypond notation-->"{...}"という具合になるべきかな
  • 2019-07-11T13:19:57Z via Identi.ca Web To: Public CC:

    soweego https://meta.wikimedia.org/wiki/Grants:Project/Hjfocs/soweego Wikidataを外部典拠とリンクして信頼性を高めることを目的に、機械学習を利用して自動的に曖昧さ解決を行いリンク候補を提示するツールを開発、MusicBrainzなどをターゲットに展開するというプロジェクト。ファンドが認められ、2017/18年に初期段階、2018-07から現プロジェクト実施中ということらしい
  • 2019-07-01T15:01:19Z via Identi.ca Web To: Public CC:

    Trip Report: ESWC 2019 https://thinklinks.wordpress.com/2019/06/28/trip-report-eswc-2019/ 領域専門家による小規模オントロジーをターゲットスキーマと呼び、その充実がNLPなどのアプリケーションで利用できる、それにはShExも使える。さらに文書マイニングなどをもとに領域記述のプロパティを抽出し、それらを自動生成することも。知識グラフの構築や使いやすさなどのエンジニアリング面も
  • 2019-06-24T14:54:08Z via Identi.ca Web To: Public CC:

    件の論文DBpedia FlexiFusion Best of Wikipedia > Wikidata > Your Data:PreFusionとして複数章(言語)DBpediaからsameAsクラスターにGlobal IDを付与=normalize、同じS-P対を持つ文をグループ化して(object, provenance)リスト→不要な値をreduce、矛盾する値をresolve(関数プロパティなど利用)=aggregate。これらを6言語群に適用して個別より精度が向上すること、カタラン語版にそれを当てはめることでリッチ化できることを検証。Global ID https://global.dbpedia.org/
  • 2019-06-23T11:48:36Z via Identi.ca Web To: Public CC:

    Create RDF dump of structured data on Commons https://phabricator.wikimedia.org/T221917 コモンズの構造化データRDFを定期的にダンプとして生成するということで検討中。前回のRDFフォーマット提案と関係あるのかどうかよくわからないが
  • 2019-06-23T03:30:42Z via Identi.ca Web To: Public CC:

    Re: Scaling Wikidata Query Service https://lists.wikimedia.org/pipermail/wikidata/2019-June/013214.html Thad Guidryから、ソートが極めて重い操作であること、スケールの問題は究極的にI/Oに帰着、GoogleやIBMは資源をふんだんに使ってデータやインデックスの複製をメモリ上に置くことで高速化を実現している、など
  • 2019-06-10T15:01:35Z via Identi.ca Web To: Public CC:

    Re: DBpedia download vs DBPedia SPARQL data https://sourceforge.net/p/dbpedia/mailman/message/36682893/ どうやらDBpediaは今後databusを用いて更新していくらしい。URIもWikipedia型から変更するという話もあるようだが、いまひとつはっきりしない。ISWC論文が示されているので、読んでみてからまた考える
  • 2019-06-10T08:41:00Z via Identi.ca Web To: Public CC:

    CIDOC CRM Issue 361: Recording an E41 in RDF http://www.cidoc-crm.org/node/5718 RDFモデルでほとんどすべての値をクラスにしており、文字列値をどう記述するかが未だに不明確という、昨年1月の問題提起は結局放置されたまま。RDFでなにか記述しようとしたら、これがクリアされないことには何もできないのに