KANZAKI, Masahide masaka@identi.ca

Tokyo, Japan

A pure tone enthusiast bass player. maybe a little of semantic web stuff

  • 2025-09-30T08:21:05Z via Identi.ca Web To: Public CC:

    Protoknowledge Shapes Behaviour of LLMs in Downstream Tasks: Memorization and Generalization with Knowledge Graphs https://arxiv.org/abs/2505.15501 自然言語の問をSPARQLに変換して知識グラフを利用するにあたり、LLM が語彙的/階層的/位相的な「プロト知識」を内在化しているという仮説を立て、プロンプト設計の違いとあわせて評価タスクを通じて検証し、さらに知識分布に由来する意味的バイアスを明らかにした
  • 2025-09-30T07:46:44Z via Identi.ca Web To: Public CC:

    Large Language Models (LLMs) as Powerful Generic RDF Clients https://www.linkedin.com/pulse/large-language-models-llms-powerful-generic-rdf-clients-idehen-xwhfe ブラウザのような使いやすいクライアントが無いために利用者にとって敷居が高かったRDFにとってLLMこそが求められていた汎用クライアントになる、と。例えばノートから知識グラフを生成、グラフ視覚化、APIドキュメントの自動生成など。やや大げさ過ぎるが、まぁそういう可能性は十分ある
  • 2025-06-30T14:06:07Z via Identi.ca Web To: Public CC:

    Enabling AI as a Reliable Partner in Human Problem-Solving https://stratml.us/docs/EARP.xml AIの知識表現のための基礎が必要といった議論のスレッドで、そうしたドメイン分類をやっているよという話。元のスレッドは https://lists.w3.org/Archives/Public/public-lod/2025Jun/0004.html
  • 2025-05-31T12:41:31Z via Identi.ca Web To: Public CC:

    Which parties carry what costs of text/turtle changes, and do those outweigh which benefits for whom? https://github.com/w3c/rdf-star-wg/issues/141 RDF 1.2でTurtleを始め具象構文に従来のパーサーでは処理できない要素が加わって後方互換性が保てないことについて、1行目に@versionを加える、応答ヘッダのcontent-typeにversionパラメータを加えるなど議論。1月に提起され2月にはWGのテレカンでも議論 https://www.w3.org/2025/02/13-rdf-star-minutes.html#fc3f
  • 2025-05-31T01:59:44Z via Identi.ca Web To: Public CC:

    Passage: Ensuring Completeness and Responsiveness of Public SPARQL Endpoints with SPARQL Continuation Queries https://dl.acm.org/doi/10.1145/3696410.3714757 エンドポイントからの応答が途中で切れてしまう時、部分結果だけでなく継続クエリも返す手段として、Passageを提案。Blazegraph上に実装して性能を評価した
  • 2025-03-25T02:38:05Z via Identi.ca Web To: Public CC:

    Tools for the Semantic Web https://semantic-tool-hub.github.io/ オントロジー構築からSPARQLインターフェイスまでSW関連ツールを整理分類し、Wikidataに登録して的確な発見と利用を可能にしようという試み。2024ESWCでの発表あり
  • 2025-03-25T01:55:00Z via Identi.ca Web To: Public CC:

    Ontology-grounded Automatic Knowledge Graph Construction by LLM under Wikidata schema https://arxiv.org/abs/2412.20942 自然言語で書かれた文書からLLMで知識要件質問(CQ)を自動生成し、さらにそれを用いてLLMで文書群から抽出した関係をWikidataプロパティによるRDFで記述して知識グラフを生成するというもの
  • 2025-02-27T00:15:47Z via Identi.ca Web To: Public CC:

    Visualizing Wikibase ecosystem, using wikibase.world  https://addshore.com/2025/02/visualizing-wikibase-ecosystem-using-wikibase-world/ Wikidataをはじめとするさまざまなプロジェクトのデータ可視化の試み報告。SPARQLサービスのクエリ結果でグラフが描けるのは知らなかった
  • 2025-02-22T08:12:26Z via Identi.ca Web To: Public CC:

    Linked Art Data Model https://linked.art/model/ 5年越しの議論を経て1.0に到達したと。CIDOC-CRMにGetty語彙を加えたRDFをベースに、そのややこしさをラップしてJSON-LDにするために3200行超のコンテクストを用意している。使う気にはならないがここまでコミュニティをリードした点ではRobは流石だとは思う。ML告知 https://groups.google.com/g/linked-art/c/fvUo1e83UIY/m/-7mbbdc_AgAJ
  • 2025-01-09T01:41:42Z via Identi.ca Web To: Public CC:

    RDF Notes Maintenance Community Group https://www.w3.org/community/rdf-maintenance/ すでに閉じられたSemantic Web IGによるノート(N項関係記述、語彙BPなど多数)を維持・更新するためのCG発足。W3Cの文書ライセンスは派生(derivative work)を認めていないので、CGでもこれが可能になるよう調整するとのこと
  • 2024-12-29T07:38:57Z via Identi.ca Web To: Public CC:

    Proposal for RDF-star Minimal Baseline https://lists.w3.org/Archives/Public/public-rdf-star-wg/2024Jul/0078.html さらにここからProposal: described vs stated triple terms https://lists.w3.org/Archives/Public/public-rdf-star-wg/2024Jul/0109.html が出され、8/1の改訂草案で引用トリプルが具体化トリプル(Reified Triples)となる
  • 2024-12-29T01:45:08Z via Identi.ca Web To: Public CC:

    BI and EAI through Semantic Web https://lists.w3.org/Archives/Public/semantic-web/2024Dec/0021.html あらゆるデータをETL(抽出、変換、ロード)でトリプルに変換し、様々な領域のアプリケーション統合のためにSemWebを使う提案。データソース、集約、アライメント、アクティベーション、APIの5層のサービスから成るという。Sebastian Samarugaから
  • 2024-12-29T01:32:40Z via Identi.ca Web To: Public CC:

    Semantic Web: Past, Present, and Future https://drops.dagstuhl.de/entities/document/10.4230/TGDK.2.1.3 TGDK Vol 2, Issue 1の記事。SemWebのアーキテクチャからグラフデータの表現、検証、リンクと推論、統合クエリによるリンクするデータの検索、来歴など。応用面でschema.orgやWikidataも。ML紹介 https://lists.w3.org/Archives/Public/semantic-web/2024Dec/0025.html
  • 2024-11-30T14:12:53Z via Identi.ca Web To: Public CC:

    Linked Web Storage Working Group https://www.w3.org/groups/wg/lws/ Solidをプロトコルを正式な仕様にするWGはLinked Web Storageとして9月に発足。ウェブサービス提供者が利用者にデータの権利を放棄させるというモデルから、異なるサービス間で相互運用可能なような記述のため、LWSプロトコルの標準化を目指す
  • 2024-11-30T13:26:51Z via Identi.ca Web To: Public CC:

    CRDT for RDF Community Group https://www.w3.org/community/crdt4rdf/ Conflict-Free Replicated Data Types(競合しない複製データ)という分散処理でローカルでデータを作ってもうまく統合できる仕組みをRDFに適用しようという試み。すでにいくつか存在するのでそれらをコーディネートして行こうというCGが発足
  • 2024-11-30T13:16:35Z via Identi.ca Web To: Public CC:

    Re: polymorphic RDF mapping https://lists.w3.org/Archives/Public/semantic-web/2024Sep/0035.html JSONをRDFにマッピングする方法という質問に対して、RMLMapperや論文(Declarative RDF graph generation from heterogeneous (semi-)structured dat)を紹介。RMLはKnowledge Graph Construction CGで継続されているらしい
  • 2024-09-30T14:09:29Z via Identi.ca Web To: Public CC:

    Diff'ing RDF files https://lists.w3.org/Archives/Public/semantic-web/2024Sep/0011.html RDF正規化(canonicalization)を利用して差分を調べるツール。正規化アルゴリズムはわずかの違いでも空白ノードIDをすべて変えてしまう可能性があるので、過検出があり得る→カウンターではなくノードのハッシュでbnodeIdを付与すれば。他にturtle-formatterとかEDMのrdf-toolkitもあるよ、など
  • 2024-09-30T14:08:57Z via Identi.ca Web To: Public CC:

    Call for content review: Accessible IIIF Manifests https://groups.google.com/g/iiif-discuss/c/lj5YaBo_l1s/m/je_jSDOHAgAJ アクセシビリティに関するメタデータを{"label": {"en": ["Screen Reader Friendly"]}, "value": {"en": ["No"]}}という感じで加えるという提案。ほかAccessibility FeaturesをWAI語彙で記述するなど。アクセシブルなIIIFとは構造化、代替手段の提供などらしい
  • 2024-08-31T14:33:45Z via Identi.ca Web To: Public CC:

    News update semantic HTML vocabulary https://lists.w3.org/Archives/Public/public-htmlvoc/2024Aug/0000.html htmlvocはHTMLのDOMツリーをかなり忠実にRDF化しているようで、Turtleを見るとごちゃごちゃだがLD Browserやgraph-drawで見ると案外素直な構造になっている。Pythonツールで変換できるということらしい
  • 2024-07-29T13:08:20Z via Identi.ca Web To: Public CC:

    Notes on Linked Data, terminology and marketing https://lists.w3.org/Archives/Public/www-archive/2012Oct/0119.html 先日の動画のためにいろいろ遡って確認する時に参照点になったdanbriの2012年のMLポスト。PICS、MCF、RDF、Linked Dataという変遷の要点を整理していてさすがの内容