dataC:修订间差异

来自运维百科
无编辑摘要
无编辑摘要
 
(未显示同一用户的3个中间版本)
第1行: 第1行:
dataC是一个可定义流程的,可使用大模型进行数据抓取工具。dataC定位于异构系统之间的数据转换,异构系统包括网页数据、磁盘文件等。
dataC,中文名叫灯塔,是一个基于工作流+AI的应用工具,可用于Web应用和API测试,Web页面数据采集,异构系统间数据迁移。


== dataC 2025.1.0 主要功能 ==
dataC追求普适性,也就是无论多刁钻的页面,都能通过灵活的流程编排能力进行采集。也是这个原因,需要使用者具有一定的Web前端知识。
[[File:流程界面.png.webp]]
 
=== 多流程 ===
dataC提供Web API插件定义功能,让我们可以自由定义API访问方法节点,在流程中使用。
dataC的工作以任务为单位,一个任务可以是一项复杂的工作,比如收集地址、采集数据、分析数据、提交系统等。
 
为了完成一项复杂的任务,dataC支持一个任务多流程功能,使我们可以将复杂的任务拆解成简单的流程,分步处理。
dataC提供系统内置大模型方法节点,包括文字对话和图片理解,可以在流程节点中分析复杂的Web页面数据和图片数据。
=== 数据表 ===
 
在数据处理的中间环节,我们需要存储数据,dataC的数据表功能可满足此需求。
dataC也提供了自定义大模型接入点方法,使用者可以定义私有大模型接入点,在流程节点中使用。
dataC将数据表分为本地和云端两列显示,通过定义的关键字段对应。
 
=== 变量 ===
dataC内置一个浏览器,可以通过流程节点,通过数据传递、元素点击、视图滚动等方法,模拟人的操作,因此能够采集分级、动态的复杂结构数据。
我们还可以定义变量,用于流程执行过程中保存临时数据。
 
=== 内置浏览器 ===
dataC为我们提供了丰富的节点,如Base64编码、JSON编码、Excel读写、变量读写、表读写等,让我们可以编排功能强大的流程。
dataC的内置浏览器,可以通过流程节点与浏览器交互,提取数据、设置元素值、触发点击。
 
=== HTTP插件 ===
总的来说,dataC用于数据采集是非常强大,虽然学习曲线稍高,但很值得。
我们可以定义HTTP插件和方法,去对接不同的系统。HTTP插件是全局的,一个插件可以用于不同的任务。
 
=== 大模型 ===
[[File:dataC流程编排界面.png.webp|dataC流程编排界面]]
配置大模型,是的流程节点可以将分析任务交给大模型处理。
=== 节点类型 ===
[[File:节点类型.png.webp]]

2025年10月29日 (三) 10:59的最新版本

dataC,中文名叫灯塔,是一个基于工作流+AI的应用工具,可用于Web应用和API测试,Web页面数据采集,异构系统间数据迁移。

dataC追求普适性,也就是无论多刁钻的页面,都能通过灵活的流程编排能力进行采集。也是这个原因,需要使用者具有一定的Web前端知识。

dataC提供Web API插件定义功能,让我们可以自由定义API访问方法节点,在流程中使用。

dataC提供系统内置大模型方法节点,包括文字对话和图片理解,可以在流程节点中分析复杂的Web页面数据和图片数据。

dataC也提供了自定义大模型接入点方法,使用者可以定义私有大模型接入点,在流程节点中使用。

dataC内置一个浏览器,可以通过流程节点,通过数据传递、元素点击、视图滚动等方法,模拟人的操作,因此能够采集分级、动态的复杂结构数据。

dataC为我们提供了丰富的节点,如Base64编码、JSON编码、Excel读写、变量读写、表读写等,让我们可以编排功能强大的流程。

总的来说,dataC用于数据采集是非常强大,虽然学习曲线稍高,但很值得。

dataC流程编排界面