语言 / Languages: English | 简体中文
DLRS Hub(数字生命仓库标准中心)是一个用于管理数字生命档案的标准化系统。它提供了一个框架,用于存储、组织和控制对个人数字表示的访问,包括语音样本、图像、视频和个人数据。
DLRS Hub 专为以下人群设计:
- 个人 - 希望保存数字遗产的人
- 家庭 - 管理已故亲人纪念档案的家庭
- 研究人员 - 研究数字身份和 AI 伦理的学者
- 组织 - 构建数字人应用的机构
- 开发者 - 创建 AI 语音/虚拟形象克隆系统的开发者
是的,DLRS Hub 是 MIT 许可证下的开源项目。你可以自由使用、修改和分发。
答案:原始音视频、人脸、声纹和证件属于高敏感数据。GitHub 不适合存储大型二进制文件,因为:
- 大小限制:大文件会使 Git 仓库变慢和臃肿
- 永久历史:一旦提交,文件很难从 Git 历史中完全删除
- 隐私风险:敏感的生物识别数据不应该在公共版本控制中
- 合规要求:许多司法管辖区对生物识别数据有特定的安全要求
相反,DLRS Hub 存储指针文件(.pointer.json),引用安全对象存储(S3、OSS 等)中的数据,同时在 Git 中保留元数据和审计信息。
指针文件是一个 JSON 文件,包含存储在其他地方的文件的元数据:
{
"artifact_id": "voice_001",
"type": "voice_sample",
"storage_uri": "s3://my-bucket/audio/voice.wav",
"checksum": "sha256:abc123...",
"size_bytes": 1048576,
"sensitivity": "S3_BIOMETRIC"
}这种方法将敏感数据与版本控制分离,同时保持可追溯性。
DLRS Hub 支持任何 S3 兼容的对象存储:
- AWS S3(国际)
- 阿里云 OSS(中国)
- 腾讯云 COS(中国)
- Google Cloud Storage(国际)
- MinIO(自托管)
- Backblaze B2(国际)
运行验证工具:
python tools/validate_repo.py这会检查:
- JSON schema 合规性
- 必填字段存在性
- 文件结构正确性
- 敏感文件检测
- 同意文档
不是。 档案默认是私有的(visibility: private)。公开索引需要:
- 明确授权(
allow_public_listing: true) - 已验证同意徽章
- 人工审核批准
你也可以使用 public_unlisted 来创建可通过直接链接访问但不可搜索的档案。
联系你的 manifest.json 中指定的端点:
"consent": {
"withdrawal_endpoint": "mailto:privacy@example.org"
}系统将:
- 立即冻结运行态
- 保留审计日志(法律要求)
- 删除保留期后的个人数据
- 移除公开索引
可以,但有限制:
- 需要监护人同意(
consent.guardian_consent: true) - 不能公开索引
- 适用额外的隐私保护
- 必须遵守 COPPA(美国)、GDPR(欧盟)或当地法律
已故者的档案需要:
- manifest 中
status: "deceased" profile/inheritance_policy.json指定继承人- 执行人联系信息
- 默认操作:冻结档案
不是。 这一点非常重要:
- 所有输出都是 AI 生成或 AI 辅助的内容
- 它们不代表真人的即时真实想法
- 它们是基于训练数据的模拟
- 所有输出必须标记为 AI 生成
把它看作数字纪念或助手,而不是真人的替代品。
只有在明确授权的情况下。 检查档案的 manifest.json:
"rights": {
"allow_commercial_use": true, // 必须为 true
"allow_voice_clone": true, // 用于语音应用
"allow_avatar_clone": true // 用于虚拟形象应用
}未经授权的商业使用是:
- 违反档案许可证
- 可能违法(公开权、人格权)
- 可能被下架和法律诉讼
这取决于授予的权限:
| 权限 | 允许的使用 |
|---|---|
allow_public_listing |
在公开索引中查看 |
allow_model_finetune |
训练 AI 模型 |
allow_voice_clone |
创建语音合成 |
allow_avatar_clone |
创建数字虚拟形象 |
allow_commercial_use |
商业应用 |
allow_research_use |
学术研究 |
使用前始终检查特定档案的权限。
检查这些指标:
- 已验证同意徽章(
review.verified_consent_badge: true) - 来源信息 在
audit/provenance.json中 - 同意证据 在
consent/目录中 - 审核状态(
review.status: "approved_public") - 审计追踪 在
audit/access_log.pointer.json中
对没有这些验证的档案要谨慎。
DLRS Hub 提供了 GDPR 合规的工具和框架,但是:
该框架支持:
- 访问权(数据导出)
- 删除权(删除策略)
- 更正权(版本控制)
- 数据可移植性(JSON 格式)
- 同意管理(同意记录)
建议:在生产部署前咨询律师。
同样的原则适用:DLRS Hub 提供框架,但你必须确保符合你所在司法管辖区的适用法律。
考虑:
- 美国:CCPA(加州)、COPPA(儿童)
- 加拿大:PIPEDA
- 中国:个人信息保护法(PIPL)
- 日本:个人信息保护法(APPI)
- 韩国:个人信息保护法(PIPA)
是的,如果你要在生产环境中部署。 特别是对于:
- 面向公众的服务
- 商业应用
- 跨境数据传输
- 涉及未成年人的服务
- 纪念/已故者档案
policies/ 和 templates/consent/ 中的模板仅是起点,不构成法律建议。
徽章表示验证状态:
- 🔵 verified-consent:同意已被审核者验证
- 🟢 public-data-only:仅包含公开信息(无生物识别)
- 🟡 research-approved:批准用于学术研究
- 🔴 commercial-licensed:授权商业使用
- 提交包含完整同意文档的档案
- 包含同意声明(
consent/consent_statement.md) - 提供同意视频或签名(
consent/consent_video.pointer.json) - 通过自动验证
- 通过维护者的人工审核
- 徽章在
review.verified_consent_badge中签发
- 自动验证:schema、结构、敏感文件
- 人工审核:同意验证、内容审核
- 徽章签发:已验证徽章添加到 manifest
- 公开索引:档案添加到
registry/humans.index.jsonl - 持续监控:定期重新验证
- 仔细阅读错误信息
- 查看示例档案:
humans/asia/cn/dlrs_94f1c9b8_lin-example/ - 验证所有必填字段都存在
- 确保 JSON 语法有效
- 运行
python tools/check_sensitive_files.py - 查看快速上手指南
# 从 Git 历史中删除(谨慎使用!)
git filter-branch --force --index-filter \
"git rm --cached --ignore-unmatch path/to/large/file" \
--prune-empty --tag-name-filter cat -- --all
# 强制推送(只有在确定的情况下!)
git push origin --force --all更好的方法:从一开始就使用 .pointer.json 文件!
- 编辑档案目录中的文件
- 更新
manifest.json中的audit.last_modified_at - 运行验证:
python tools/validate_repo.py - 提交并推送更改
- 如果是公开的,索引将自动更新
查看贡献指南了解详情。你可以:
- 添加你自己的档案
- 改进文档
- 修复工具中的 bug
- 翻译到其他语言
- 提出标准改进建议
- GitHub Issues:https://github.com/Digital-Life-Repository-Standard/DLRS/issues
- 邮箱:https://github.com/Digital-Life-Repository-Standard/DLRS/discussions
- 安全问题:https://github.com/Digital-Life-Repository-Standard/DLRS/security/advisories/new
- 文档:docs/
可以!DLRS Hub 是开源的(MIT 许可证)。你可以:
- 直接使用
- Fork 并修改
- 在其上构建商业服务
- 贡献改进
只需确保遵守适用的隐私法律。
artifacts/:原始源材料(音频、视频、图像)derived/:从制品派生的处理数据(嵌入向量、记忆原子、实体图)
派生数据通常由 AI/ML 管道生成,敏感度低于原始制品。
检查档案的 rights.cross_border_transfer_basis:
none:不允许跨境传输consent:经明确同意允许contract:根据合同条款允许adequacy:允许传输到有充分保护的司法管辖区scc:根据标准合同条款允许
始终验证是否符合 GDPR 第 44-50 条或等效的当地法律。
可以!DLRS Hub 设计为可自托管:
- 克隆仓库
- 设置对象存储(S3、MinIO 等)
- 配置访问控制
- 部署验证工具
- 设置 CI/CD 进行自动检查
查看架构了解部署指导。
如果你的问题在这里没有得到解答:
- 查看完整文档
- 搜索 GitHub Issues
- 使用
question标签开一个新 issue - 发邮件给我们:https://github.com/Digital-Life-Repository-Standard/DLRS/discussions
我们在这里帮助你!💙