北京市朝阳区人民法院审结的一起微信视频号数据抓取不正当竞争纠纷案,彻底打破了行业灰色默契,为全网短视频数据商业化使用确立了清晰的司法边界。
一、公开数据的“默认抓取”乱象
短视频与直播数据早已超越平台内部运营指标的单一属性,成为数字营销产业链的核心生产要素。对于品牌方而言,数据是投放策略制定的核心依据;对于MCN机构,数据是达人筛选、账号孵化的重要标尺;对于广告代理商,数据决定营销预算的分配逻辑;对于第三方数据服务商,数据更是可深度加工、商业化变现的核心资产,可转化为行业榜单、舆情监测、用户画像、热度分析、付费调研报告等标准化商业产品。
伴随数据商业价值的持续攀升,行业内长期存在一条模糊的灰色运作默契:平台投入巨额资金、技术成本与人力成本,搭建产品体系、积累用户流量、完善内容生态与数据资源,第三方数据机构则通过爬虫技术、模拟接口、规避平台风控等手段,批量抓取平台公开数据,二次加工后打造自有商业产品并对外盈利。
多数从业者对此类行为的合规性存在认知偏差,普遍以“数据公开可见”“行业通用惯例”“仅做数据分析、未搬运原创内容”为由,规避合规审视。这种长期存在的行业惯性,让批量抓取平台数据、无偿攫取平台生态价值的行为,一度成为第三方数据服务行业的常规运作模式,直至司法判例明确划定合规红线。
二、典型判例复盘:视频号数据抓取不正当竞争案核心事实
北京市朝阳区人民法院审结的一起微信视频号数据抓取不正当竞争纠纷案,彻底打破了行业灰色默契,为全网短视频数据商业化使用确立了清晰的司法边界。该案一审判决后,双方当事人均未上诉,判决已发生法律效力,成为数字数据合规领域的典型参考案例。
根据法院公开裁判信息,本案原告为微信产品及合法运营主体,其自2020年1月上线微信视频号业务以来,通过长期持续的产品研发、内容审核、生态治理、用户运营与安全防护,积累了海量短视频、直播内容及配套数据资源,形成了具备独立商业价值的数据生态与市场竞争优势。
涉案二被告共同运营“问某数据”网页平台,在未取得原告合法授权的前提下,通过技术手段规避平台访问权限、突破风控与反爬机制,大规模抓取、存储微信视频号的短视频、直播相关全量数据,并在自有平台进行数据展示、公开传播、深度加工分析,最终依托该数据资源开展商业化运营、获取经济收益。
法院经审理认定,二被告无偿占用原告长期经营积累的生态成果,未投入对等经营成本,通过不正当技术手段获取核心数据资源并用于商业变现,直接削弱了原告的市场竞争优势,扰乱了短视频行业公平有序的竞争秩序,已构成不正当竞争,最终判令二被告连带赔偿原告经济损失及合理维权开支共计110万元。
三、司法核心界定:厘清数据使用与不正当竞争的边界
本案的行业价值,远不止110万元的判赔金额,核心在于司法机关明确区分了合法数据浏览使用与非法规模化数据攫取的本质差异,否定了“技术可行即合法”“公开数据即无主资源”的行业错误认知。数据要素市场化的核心保护逻辑,并非平台对单条孤立数据的绝对垄断,而是对经营者持续投入、规则治理、生态运营所形成的合法竞争利益的司法保护。
法院在裁判中明确,普通用户的单次浏览、有限查阅、碎片化信息引用等正当使用行为,与商业主体系统性、规模化的数据攫取行为,存在完全不同的法律评价。本案中被告的行为形成了完整的非法数据变现闭环:规避平台权限校验→批量抓取存储核心数据→自有平台公开展示传播→深度加工分析→商业化变现盈利。该行为并非常规的信息聚合与行业研究,而是对平台数据生态的系统性无偿截取,完全落入《反不正当竞争法》的规制范围。
视频号数据的商业价值,并非单条视频、单场直播或单个账号信息的简单叠加,而是账号结构、粉丝画像、互动数据、播放趋势、直播热度、转化效果、达人迭代、品牌投放信号等多维数据的聚合价值。此类数据集合经过平台持续清洗、沉淀、迭代,形成了具备决策参考价值的标准化数据资产,也是平台核心的市场竞争资源。
平台设置的登录校验、接口权限、访问频次限制、反爬机制、风控规则等技术措施,并非单纯的访问壁垒,而是合法的生态治理与权益保护手段。网络场景下,“公开可见”不等于“无限制商用”,“分层可访问”更不等于“第三方可突破规则批量攫取”。一旦商业主体通过技术手段规避平台治理规则,将他人长期沉淀的数据生态转化为自身商业底座,行为性质即从合规信息使用,转变为不正当攫取他人经营成果。
四、法条适用与误区纠偏:破除行业合规认知偏差
本案的核心裁判依据为《反不正当竞争法》第二条一般条款与第十二条网络不正当竞争专项条款,构建了完整的司法评价体系。其中,第二条明确经营者在市场竞争中需遵循自愿、平等、公平、诚信原则,恪守法律与商业道德,禁止扰乱市场竞争秩序、损害其他经营者合法权益的竞争行为;第十二条专门规制网络场景下,经营者利用技术手段干扰、破坏其他经营者合法网络产品及服务正常运营的不正当竞争行为。
司法裁判并未纠结“单条数据的所有权归属”这一伪命题,而是采用综合评判标准,从四个核心维度认定行为不正当性:一是原告对视频号生态存在长期、持续的经营投入,数据集合具备明确商业价值与竞争属性;二是被告数据获取方式违法,通过规避技术措施、未经授权批量抓取,丧失正当性基础;三是被告行为属于规模化商业变现,远超合理研究、引用范围,构成典型“搭便车”行为;四是行为破坏行业秩序,释放“技术凌驾规则”的错误信号,损害公平竞争环境。
针对行业普遍存在的三大合规误区,本案作出了明确纠正:
第一,纠正“仅做数据分析即合规”的误区。合法的数据分析,依托于合规渠道获取数据、依托自有算法模型形成独立研究成果,具备自主创新价值。而本案中被告的数据分析服务,核心价值完全依托于非法抓取的平台全量数据,所谓“分析”只是非法数据变现的包装手段,无独立创新价值,本质是无偿挪用他人经营成果。
第二,纠正“行业惯例即合法”的误区。批量抓取公开数据的行业乱象,本质是平台取证难、维权成本高导致的市场沉默状态,并非法律授权、更非合规依据。商业行为的合法性由法律规则界定,而非行业陋习决定,尤其在平台已设置风控与反爬措施的前提下,规避规则的抓取行为,不会因普遍存在而豁免法律责任。
第三,纠正“著作权不保护事实数据即可以随意抓取”的误区。著作权法仅不保护单纯的客观事实数据,但并不豁免数据获取、使用环节的不正当竞争行为。数据合规评价需综合考量经营投入、商业价值、获取手段、使用场景与市场影响,不能以著作权法的保护边界,规避反不正当竞争法的行为规制。
五、全行业合规启示:多主体重构数据商业逻辑
本案并非否定第三方数据服务行业的商业价值,而是推动行业完成合规升级:数据服务商的核心竞争力,必须从“抓取规模最大化”转向“来源合规化、授权完整化、加工独立化、使用克制化”,为全产业链划定合规运营准则。
对于第三方数据服务商,需建立全流程合规体系:一是数据来源可溯源,优先通过官方合规接口获取数据,必要时取得主体书面授权,做到“来源清晰、依据充分、用途明确”;二是采集遵循最小必要原则,禁止全景镜像式批量复制平台数据、搭建替代性数据库,规避实质替代原平台服务的合规风险;三是产品形态保持独立性,聚焦数据洞察、趋势分析、决策辅助等增值服务,不得复刻平台核心功能、分流平台用户、替代原服务场景;四是完善合规台账管理,留存授权文件、接口日志、规则评估、整改记录等全套证据,收到平台警告、律师函后及时整改,规避主观过错加重责任。
对于内容平台方,数据权益保护不能仅依赖事后诉讼,需构建常态化合规防护与证据留存体系。日常运营中完整留存产品研发、生态治理、安全防护、反爬策略、异常访问监测、用户协议迭代、维权沟通记录等证据,将无形的经营投入转化为可司法举证的客观事实,为数据权益维权提供完整支撑。
对于品牌方、MCN机构、广告代理商等数据采购方,需建立供应商合规筛查机制。摒弃“唯价格、唯数据量、唯可视化效果”的采购思维,对标注“全网独家数据”“内部接口数据”“穿透账号数据”的产品重点核查,要求服务商出具数据来源证明、授权文件与合规承诺,杜绝采购非法数据产品引发的连带合规风险。
六、案件核心价值:确立数据流通的底层规则
本案确立的核心规则并非“平台垄断公开数据”,而是有投入才有收益、有授权才能流通的数字经济底层逻辑。数据合规边界并非由单一要素判定,而是结合数据属性、技术措施、授权情况、采集规模、使用场景、市场影响等多重因素综合界定。个人合理查阅、媒体少量引用、企业内部复盘等合规行为,与商业规模化抓取、存储、变现的非法行为,存在本质区别。
数字经济鼓励数据要素流通与商业创新,但流通的前提是合法合规、权责清晰。良性的数据市场,应当保护持续投入、自主创新的市场主体,而非纵容依托技术漏洞、无偿攫取他人生态成果的投机行为。平台无需借助数据保护实施市场封锁,第三方机构亦不能假借数据开放之名侵占他人经营成果。
此次110万元判赔案给出了明确的行业答案:数据不是无主之矿,技术能力不是规避规则的通行证。任何商业创新都不能建立在对他人长期经营成果的系统性截取之上。对于全产业链参与者而言,可持续的核心竞争力,从来不是规避规则的抓取能力,而是合规可控的数据源、自主创新的加工能力、边界清晰的商业运营模式。
本文基于公开典型案例信息整理撰写,相关案号、当事人信息及具体裁判文书内容,以人民法院官方公开渠道发布的口径为准。本文仅供行业研究与合规参考,不构成针对任何具体事项的法律意见。
