🫐 艺术市场知识图谱

博士研究核心基础设施 · 清华美院艺术史论系

25
核心实体
15+
核心关系
v0.2
本体版本
13
文献覆盖

🎯 项目概述

目标

为中国当代艺术市场构建知识图谱,作为博士研究的基础设施。通过结构化艺术市场中的实体、关系与事件,支撑量化研究与智能问答。

技术路线

知识图谱 Interleaved Agentic RAG LLM

📐 本体设计 v0.2

🔄 v0.1 → v0.2 Diff(2026-03-05)

反馈来源:导师/同行讨论 2026-03-05

新增 修改 拆分

实体变更(18 → 25):

关系变更(8 → 15+):

建模增强:

核心实体(25类)
v0.1保留 v0.2修改 v0.2新增

艺术家 ✏️ 画廊 ✏️ 拍卖行 藏家 策展人 美术馆 基金会 展览 ✏️ 拍卖场次 博览会 ✏️ 作品 ✏️ 系列 拍卖成交记录 一级市场交易记录 媒介 艺术运动 ✏️ 地域

🆕 版数 Edition 🆕 价格水平 ArtistPriceLevel 🆕 学术机构 🆕 驻留项目 🆕 奖项 🆕 媒体报道 🆕 流派归属断言 🆕 媒体(机构)

核心关系(15+)
v0.1保留 拆分 v0.2新增

独家代理 exclusive 区域代理 regional 项目合作 project 寄售 consignment 参展 exhibits_in 举办 hosts 共展 co-exhibited ✏️ 参加博览会 participates_in 策划 curates 收藏 collects 转型 transforms_into

🆕 educated_at 🆕 mentored_by 🆕 residency_at 🆕 awarded 🆕 has_edition 🆕 covered_by 🆕 attributed_to_movement

💡 核心洞察:代理关系语义化(4种)+ 共展网络加权 = 更精确的市场定位分析

🤝 代理关系语义化 v0.2

represents 拆分为 4 种关系,反映真实市场中代理绑定的复杂度:

关系绑定强度说明
exclusive_representation★★★★★独家全球/区域代理
regional_representation★★★★特定区域代理(如大中华区)
project_collaboration★★★项目制合作,非长期绑定
consignment★★寄售,最弱绑定

每种均含 formality(合同/口头/隐含)、start/end_dateupgrade_from(关系升级路径)

🖼️ Edition 版数建模 v0.2

从 Artwork 拆出独立实体,解决版数作品(版画/摄影/雕塑铸造)的追踪问题:

💡 动机:同一件作品的不同版数在市场上表现可能差异巨大(版数1 vs 版数8 价格相差数倍),必须独立追踪

📰 MediaCoverage 媒体报道 v0.2

媒体报道作为事件实体建模,支持量化分析艺术家/展览/画廊的媒体曝光度:

🔬 数据建模设计

📊 数据可信度 + 时效性 v0.2

三级可信度:

时效性衰减 decay_rate:

每条数据附带:{confidence, source_type, valid_from, valid_until, decay_rate}

💰 价格建模

数据来源分层:

🆕 ArtistPriceLevel:系数时间序列实体,追踪 coefficient(元/sqcm) 随时间的变化

二级市场:拍卖记录 + 异常检测(anomaly_score)

价格事件作为独立实体建模

🔗 共展网络权重函数 v0.2

weight = f(exhibition_type, institutional_weight, context, recency)

exhibition_type 权重:

context 权重:

加上 institutional_weight(机构声望系数)和 recency(时间衰减因子)

💹 Flipping 检测 v0.2

定义:一级市场购入后短期进入拍卖转售

关联指标:flipping_ratio = 落槌价 / 一级市场价

高频flipping的画廊可能暗示市场操纵,可交叉验证同一藏家行为模式

🧑‍💼 藏家分层建模
🎨 Career Stage 推导 待验证

⚠️ 待实证检验 — 需10个代表性艺术家 bottom-up 验证

阶段触发条件(满足任一)
Emerging默认初始;首次画廊展览
Mid-career首次机构个展;tier-2+画廊独家代理;拍卖破50万
Established蓝筹画廊代理;回顾展;拍卖破500万;大型双年展

阈值需校准 · 不同媒介阈值可能不同 · 需考虑逆向流动

⏱️ 时间建模

📖 方法论

Top-down + Bottom-up 交叉验证 v0.2

Movement归属的"断言"处理:

通过 MovementAttribution 断言实体,记录"谁在什么时候说X属于Y流派",而非直接标注。支持同一艺术家被不同来源归属到不同流派,保持学术中立。

学术贡献定位:

📚 文献地图(13篇)

🔍 综合发现摘要
🚀 研究空白(我们的机会)
🔴 直接相关(4篇)

与项目核心目标(艺术市场KG+预测)直接对应

1. ArtRAG — Wang et al. · ACM MM 2025

无需训练,自动从领域文本构建Art Context KG (ACKG),通过多粒度结构化上下文检索器选取子图指导MLLM生成artwork解释。在SemArt/Artpedia超越训练基线。

可迁移:ACKG自动构建多粒度子图检索Training-free RAG

与项目关系:ACKG实体类型与ontology高度对应;多粒度检索策略可直接用于KG查询层;为"艺术品解读"功能提供架构参考

6. GPT-3 Enabled KG — Graham, Yates et al. · PLOS ONE 2023

用GPT-3半自动从129篇文章提取SPO三元组构建KG,Ampligraph训练KG Embedding做链接预测,发现未知交易商-博物馆关联。节省数月人力。

可迁移:LLM→SPO三元组提取KG Embedding链接预测半自动KG构建pipeline

与项目关系:最直接可迁移 — pipeline几乎原样复用于中国艺术市场;one-shot prompt可适配ontology schema

9. Temporal R-GCN — Jeyaraman · SMU Thesis 2025

提出时序关系图卷积网络(T-RGCN)用于金融预测,在标准R-GCN上引入时间维度建模实体关系演化。

可迁移:Temporal R-GCN动态KG建模GNN价格预测范式

与项目关系:最直接可迁移到价格预测的GNN方法 — 艺术市场天然是时序图,可与Transaction/Exhibition等时序实体配合

11. ArtGraph + 多模态分类器 — Castellano et al. · AIxIA 2023

团队:CILAB, University of Bari(意大利巴里大学AI实验室)

方法:

可迁移:PyG + HeteroData + GATConv多任务分类框架ArtGraph v2种子数据

与项目关系:ArtGraph已有gallery节点(仅作收藏机构),可扩展为市场实体;多任务框架可迁移为画廊tier、career_stage、价格区间预测;他们做艺术史/视觉分析,我们做市场/商业分析——互补而非竞争

🟡 方法可迁移(5篇)

核心方法/框架可迁移到本项目

2. KG vs LLM: Virtual Museums — Vasic, Fill et al. · ACM JOCCH 2025

比较本体(CIDOC-CRM)、LLM扩展、纯LLM三种策略支持虚拟博物馆。结论:本体+LLM组合最优。

可迁移:CIDOC-CRM标注pipeline三方对比评估框架LLM辅助KG生成

与项目关系:验证KG+LLM混合路线正确性;ontology v0.2可映射CIDOC-CRM实现互操作

5. AKDF: Art Knowledge-Driven Classification — Chen, Wang et al. · ICASSP 2025

多模态框架:增强双线性池化融合文本+图像,标签嵌入对比学习,纹理特征+体裁多任务学习。WikiArt提升3+%。

可迁移:Bilinear PoolingLabel Embedding+对比学习多任务学习

与项目关系:风格分类→自动标注ArtMovement;Bilinear Pooling融合视觉+KG嵌入;对比学习增强entity embedding

7. LLM+KG for Relational Search — Malikova · Aalto Thesis 2025

比较KG检索、LLM生成、RAG三种关系搜索方法。芬兰文化史领域。结论:混合方案最优,LLM对小众人物幻觉严重。

可迁移:RAG pipeline设计关系搜索prompt工程Demo应用架构

与项目关系:验证KG+LLM路线;对新兴艺术家LLM易幻觉→KG是可靠性保障;RAG架构可作查询接口基础

10. Biased Auctioneers — Aubry, Kräussl et al. · JoF 2023

NN利用视觉+非视觉特征预测拍卖价格,发现拍卖行预估存在系统性信息无效率。发表于顶级金融期刊。

可迁移:多模态价格预测NN估值偏差分析hammer-to-estimate ratio

与项目关系:拍卖行偏差→AuctionHouse实体属性(bias_score);"机器估值vs拍卖行预估"可作系统核心功能

12. Bassan — KG+DL艺术价格预测 · 帕多瓦大学硕士 2024/25 直接竞品

论文:A Data-Driven Approach to Art Price Prediction: Integrating Knowledge Graphs and Predictive Analytics

方法(摘要):

与本项目的关系:

📎 帕多瓦大学仓库 · 2024/25
🟢 技术参考(4篇)

提供特定技术点或方法论参考

3. Data-Centric AI for Art Market — Shabason, Ivanov et al.

Data-Centric AI方法提升艺术投资市场可达性和可解释性。涉及数据质量、SHAP/LIME可解释ML。

可迁移:Data-Centric AISHAP/LIME可解释性投资指标设计

与项目关系:数据质量优先;可解释性结合KG路径解释;投资视角补充Collector/Transaction语义

4. ML and Fine Art Pricing — Fedderke & Carugno · SSRN 2024

ML方法对艺术品拍卖价格建模,hedonic pricing的ML增强,XGBoost/LightGBM,大规模拍卖数据。

可迁移:Hedonic特征体系XGBoost/LightGBM baseline价格指数构建

与项目关系:hedonic特征映射ontology属性;ML baseline对比GNN;价格指数可作KG时序属性

8. Multimodal Painting Price Prediction — Indrawan et al. · IEEE ICTC 2023

多模态方法融合图像视觉特征(CNN/ViT)与结构化元数据预测绘画价格。

可迁移:多模态价格预测CNN/ViT视觉嵌入价格回归任务设计

与项目关系:视觉嵌入→GNN中Artwork节点初始特征;多模态fusion指导KG+视觉embedding设计

13. Tree-KG 框架 — 清华团队 2026
※ Wikontic 本体构建方法
🔀 技术迁移矩阵(13篇)
技术点12345678910111213
KG自动构建
KG Embedding
RAG (KG+LLM)
CIDOC-CRM对齐
多模态融合
GNN/GCN/GAT
时序建模
价格预测
对比学习
可解释性
拍卖行为分析
链接预测
本体构建方法

11=Castellano/ArtGraph · 12=Bassan · 13=Tree-KG · ← 横向滚动 →

🗺️ 实施路线

Phase 1:KG构建与冷启动 0-3月

核心参考:论文6 Graham论文1 ArtRAG论文2 Vasic论文13 Tree-KG

工具/技术栈:GPT-4/Claude APIspaCy中文NERNeo4j

Phase 2:多模态Embedding 3-6月

核心参考:论文5 Chen论文8 Indrawan论文10 Biased Auctioneers论文11 Castellano

工具/技术栈:ViT/CLIPPyKEENPyTorchPyG

Phase 3:GNN价格预测 6-9月

核心参考:论文9 Jeyaraman论文4 Fedderke论文12 Bassan

工具/技术栈:PyG (PyTorch Geometric)R-GCNXGBoost

Phase 4:RAG查询接口 9-12月

核心参考:论文1 ArtRAG论文7 Malikova

工具/技术栈:LangChain/LlamaIndexMLLM APIStreamlit

📋 待办清单

最后更新:2026-03-05 · v0.2 · 13篇文献 · ← 返回研究备忘录