KANZAKI, Masahide masaka@identi.ca

Tokyo, Japan

A pure tone enthusiast bass player. maybe a little of semantic web stuff

  • 2019-05-15T05:39:54Z via Identi.ca Web To: Public CC:

    Embracing Data Silos: Semantic Search and Analytics Innovation https://www.dataversity.net/?p=326508 LeapAnalysisのCEOエリック・リトルへのインタビュー。高コストなETLで中央DBに変換するのではなく、UIとデータサイロの間に知識グラフ層を置いて、SPARQLで問い合わせ、抽出や視覚化などを行なう。VKGという言葉こそ使っていないけれど、考え方は基本的に同じ
  • 2019-05-15T03:10:00Z via Identi.ca Web To: Public CC:

    Virtual Knowledge Graphs: An Overview of Systems and Use Cases http://www.data-intelligence.org/p/24/ 仮想知識グラフについて、概念、ツール、ユースケースが紹介されている。要は既存のRDBMSを直接統合するのではなく、R2RMLなどを用いてRDFにマッピングし、(企業の)知識をオントロジー化したものと組合せることで無理なく柔軟に統合するというもの。動的グラフだからツールの最適化が重要になる。ほか目についたのはAbdoul Macinaの博士論文(2018)、SEMANTiCS 2016でのビジネスアプリのデータ統合/同期あたり。どれも出典への参照はなく、漠然と使われている用語なのか
  • 2019-05-15T02:03:54Z via Identi.ca Web To: Public CC:

    We share Squerall a software for querying large and heterogeneous data https://lists.w3.org/Archives/Public/semantic-web/2019May/0051.html 異なるデータのスキーマをマッピングする仮想オントロジーを用いて、データ変換なしに統合的な利用を可能にするという。Apache SparkとPrestoをクエリエンジンに採用、Mavenでインストールするそうで、その辺りで残念ながら試用は断念
  • 2019-05-08T16:09:31Z via Identi.ca Web To: Public CC:

    Virtuosoでプロパティパスが時々おかしいことについて、博士論文でも言及されていた https://aic.ai.wu.ac.at/~polleres/supervised_theses/Stefan_Bischof_Dissertation_2017.pdf#page=71 プロパティ反復(transitive triple pattern)の主語/目的語に空白ノードを許さないのは、実装上そんなに大きな違いがあるのだろうか
  • 2019-05-05T14:08:18Z via Identi.ca Web To: Public CC:

    d3-sparql https://github.com/zazuko/d3-sparql エンドポイントからD3で使える形にしてデータを取得するJavaScriptライブラリらしい。CSV/TSVのパーサでd3-dsvというのも。片山さんのd3sparql.jsとは別もの
  • 2019-05-04T05:22:39Z via Identi.ca Web To: Public CC:

    RDF 1.1 Concept §3.3 "Lexical representations of language tags may be converted to lower case. The value space of language tags is always in lower case" Virtuosoが勝手に言語タグを小文字化するのは、いちおう根拠があるということになるのか。しかしVirtuosoもARQも、検索では言語タグの大小文字を区別している :(
  • 2019-04-29T10:29:55Z via Identi.ca Web To: Public CC:

    RDFstarTools https://github.com/RDFstar/RDFstarTools JenaでRDF* / SPARQL*を使えるように拡張するというプロジェクト。プロパティグラフ的記述についてのQA https://stackoverflow.com/questions/55885944/can-rdf-model-a-labeled-property-graph-with-edge-proper... を見ていて気づいた。しかしRDF*というのは検索しにくくて困る。実は2014年にメモしていたという http://twitter.com/_masaka/statuses/478768333001486337
  • 2019-04-13T02:54:52Z via Identi.ca Web To: Public CC:

    おっと、FIARじゃなくてFAIR。Findable, Accessible, Interoperable and Reusableで、オープンサイエンスの文脈でこのところ盛んにFAIR原則として言及されている。発信地はFORCE11で、NBDC研究チームが丁寧に紹介している https://events.biosciencedbc.jp/article/14
  • 2019-04-12T06:35:25Z via Identi.ca Web To: Public CC:

    Deltas, Diffs and Event Modeling https://lists.w3.org/Archives/Public/semantic-web/2019Apr/0020.html グラフの差分をとって一階述語論理表現に結びつけるというのはどうかという問いに、RDF Delta、SKOS history、LDP PATCH、eccrev(差分記述語彙)などいろいろ反応あり

    likes this.

  • 2019-04-11T15:00:26Z via Identi.ca Web To: Public CC:

    qwikidata: a python package to process Wikidata entities and dumps https://lists.wikimedia.org/pipermail/wikidata/2019-April/012927.html Wikidataのアイテム、プロパティ、語彙素(lexeme/entity)をSPARQLクエリなどを通じて扱うためのPythonパッケージ。やはりPythonなんだね。3.6以上が必要だけれど、それは厳しいんじゃないかという声があり改善検討中らしい
  • 2019-04-11T14:55:42Z via Identi.ca Web To: Public CC:

    Building Topology Ontology https://w3c-lbd-cg.github.io/bot/ 建物の何階にどんなスペースがあってそこには何がある、という具合に建築物の基本要素を記述するRDF語彙(BTOじゃなくてBOTとしたいらしい)。Linked Building Data CGは2014にできていて、何だかピンとこなかったので放置していたが、しっかり活動している様子。告知ML https://lists.w3.org/Archives/Public/semantic-web/2019Apr/0023.html
  • 2019-04-11T03:02:57Z via Identi.ca Web To: Public CC:

    Re: In search of value shapes https://lists.w3.org/Archives/Public/public-shacl/2019Apr/0002.html 日付型のような共有できる制約シェイプを別の制約の一部として組み込む手段はないかという問いに、入れ子シェイプをRDF4Jでサポートした方法の答え。SHACL使う気がないので詳しく見てないが、たぶんそういうこと
  • 2019-04-10T04:19:31Z via Identi.ca Web To: Public CC:

    Linked Data for Production: Pathway to Implementation (LD4P2) https://wiki.duraspace.org/x/Z5U7Bg LD4Pの後継プロジェクト。BIBFRAMEで記述したLDを拡大・活用、MARCデータへのLD識別子導入、Wikidataなどとの連携を掲げ、前段階での成果を踏まえた実装とLDによる発見をキーに進める。背景とゴール https://wiki.duraspace.org/display/LD4P2/LD4P2+Project+Background+and+Goals
  • 2019-04-10T04:18:54Z via Identi.ca Web To: Public CC:

    Linked Data for Production (LD4P) https://wiki.duraspace.org/x/VQJxB 図書館資源のためのLDを作るという2016-2018のプロジェクト。BIBFRAMEへのインプット、地図関連拡張GRCO、ハーバードの動画オントロジー、コロンビアのArtFrame、演奏音楽PMOなど。成果のまとめ https://wiki.duraspace.org/display/LD4P/LD4P+Outputs
  • 2019-04-09T09:36:43Z via Identi.ca Web To: Public CC:

    SEERという感情表現模倣ロボットを初めて知った(昨年発表)。眼球の動作が顔から独立し、相手の顔認識をして視線が合うように動く(あるいは表情を模倣する)ことで、コミュニケーションというかコンタクトしている印象が生まれるのに感心する。口をまったく動かさずに目と眉の動きだけで「表情」ができるのも、興味深い
  • 2019-04-05T15:12:50Z via Identi.ca Web To: Public CC:

    RDFa Initial context updated https://lists.w3.org/Archives/Public/semantic-web/2019Apr/0008.html odrlをOpen Digital Rights Language(昨年2月勧告)の接頭辞として追加したとさ
  • 2019-04-04T13:28:42Z via Identi.ca Web To: Public CC:

    Introducing AmpliGraph: a TensorFlow-based Library for Knowledge Graph Embeddings https://lists.w3.org/Archives/Public/semantic-web/2019Apr/0005.html 知識グラフの関係性を機械学習し、隠れた関係を確率として見出すpythonツール。ということでいいのかな。面白そうだけれど、condaと言われてもよく分からないのでインストールしていない https://github.com/Accenture/AmpliGraph
  • 2019-04-02T06:10:45Z via Identi.ca Web To: Public CC:

    triple-tools https://github.com/cgutteridge/triple-tools N-TriplesのRDFをSPOの値によってフィルタしたり、空白ノードをURIに置き換えたりするPerlスクリプト集。rapperに関する投稿への応答で紹介 https://lists.w3.org/Archives/Public/public-lod/2019Apr/0001.html
  • 2019-03-29T10:59:23Z via Identi.ca Web To: Public CC:

    2nd U.S. Semantic Technologies Symposium 2019 Trip Report http://www.juansequeda.com/blog/?p=317 コミュニティが新しいメンバーに対して閉じている、知識グラフを改めて定義するより使われているのをそのまま受け入れるほうがいい、実世界でSW技術が使われれいることが確認できたのは収穫、など
  • 2019-03-26T12:42:02Z via Identi.ca Web To: Public CC:

    Re: sh:uniqueLang "1"^^xsd:boolean https://lists.w3.org/Archives/Public/public-shacl/2019Mar/0020.html Turtleの略記法trueは(明示されていないが)"true"^^xsd:booleanと"1"^^xsd:booleanの両方当てはまるのに、SHACLのuniqueLangは前者しか有効でないという話から、この2つはSPARQLのFILTER(値空間比較)では=で真となるけれど、sameTerm関数(RDFターム等価)では偽になるのだと