AquaOS：人工智能如何革新水产养殖的“盲盒”时代

### **传统监测的“三座大山”：为什么经验不再可靠？**

在谈论 AIoT 的优越性之前，我想先聊聊传统养殖最令人头疼的现实。

**首先，是“老师傅”经验的断层。** 观水色、辨藻相，这些技能听起来玄学，其实是长期积累的非标准隐性知识。但在现代高密度养殖下，这种知识很难复制。我在 NUS（新加坡国立大学）做博士研究时就发现，传统决策往往滞后且不一致。一旦有经验的场长离职，整个场的产量可能瞬间滑坡。

**其次，是致命的“监测盲区”。** 人不可能24小时盯着水。哪怕是最勤快的工人，一天测两次水质已是极限。然而，水质变化是连续的。在强对流天气下，溶解氧（$DO$）可能在短短30分钟内从安全值跌至致死线。两次人工检测之间的那段空白，就是夺走几十万产值的“死亡地带”。

**最后，是永远赶不上的响应速度。** 这是最残酷的痛点。当你在池塘边看到鱼浮头时，氨氮（$NH_3-N$）或亚硝酸盐（$NO_2^-$）可能已经超标数小时了。这种滞后响应，让水产养殖始终带着一种“高风险”的标签。在我们的实际调研中，一次由于监测不力导致的倒藻事故，损失往往以十万元为单位。

全球水产养殖业正处于一场从经验驱动的传统农业向数据与知识双轮驱动的精密工业转型的历史转折点。在这一转型过程中，单纯依赖大规模数据堆砌的归纳式机器学习已逐渐显露出其在泛化能力和物理可解释性上的局限性。当前最前沿的学术研究开始回归“第一性原理”，试图将计算生物学、流体力学以及热力学能量收支模型等物理法则作为先验知识，深度嵌入到人工智能和计算机视觉的底层架构中 。在这样的逻辑原点的指导下，水产养殖的复杂系统被解构为生态化学计量学、异速生长缩放以及流体动力学等基础数学模型 。

通过将这些严谨的数学模型与深度学习框架相融合，研究人员能够构建出不仅能够识别表象，更能理解因果关系的混合智能系统 。在这一宏大背景下，物联网（IoT）、水下计算机视觉、声学传感器以及自主水下航行器（AUV）构成了该系统的感知与执行器官。本报告将对当前全球最顶尖的学术团队在水产养殖领域的应用进行详尽解读，从鱼类行为的微观识别到水下视觉算法的突破，再到水质预测的宏观物联网架构，最终延伸至欧洲高端海水网箱的数字孪生（Digital Twin）系统工程，全景式呈现机器学习与计算机视觉如何重构现代水环境与水产品监控体系。

## 一、鱼类行为学解码——摄食强度、异常反应与智能投喂决策的量化机制

水产养殖的核心资产是水生生物本身。对于实际养殖生产而言，鱼群的摄食强度、低氧应激反应、异常行为以及鱼群密度等指标，是直接决定饵料转化率（FCR）、成活率及养殖利润的基石。现在国内外不同科研团队都正致力于将鱼类复杂的群体行为学特征转化为可被机器精确计算的数学向量，从而实现从“经验投喂”向“按需精准投喂”的跨越 。

### **1.1 多模态数据融合与摄食强度的精确量化**

饲料成本通常占据商业水产养殖总运营成本的百分之六十以上。因此，精确评估鱼群的摄食强度（Feeding Intensity）以避免饲料浪费和水质恶化，是生产管理中的首要痛点。鱼类在摄食时，其群体形状、游动速度、水面波纹以及产生的水动力和声学信号会发生显著变化 。Li 和 Chen 的团队指出，传统的单一视觉模态在工业化高密度养殖或水质浑浊的环境中极易失效，因此多模态数据融合（Multimodal Fusion）成为了前沿趋势 。

在算法层面，研究人员开发了极具针对性的深度学习架构。例如，Huihui Yu 等人提出的双流三维卷积神经网络（DSC3D），该架构通过 FlowNet2 提取光流特征以捕捉动态运动，结合 3D 卷积神经网络提取时空特征 。该模型在识别鱼群的摄食、低氧、低迷、受惊和正常等五种行为状态时，平均准确率达到了惊人的 95.79%，完全满足了工业化级自动监控的需求 。为解决多模态模型中独立编码器带来的高计算成本问题，研究团队还发布了包含 27,000 个标记音频和视频片段的 AV-FFIA 数据集，并提出了一种统一的混合模态评估方法 U-FFIA 。U-FFIA 模型通过在训练期间引入模态丢失机制，使得单一模型即可灵活处理纯音频、纯视觉或音视频融合输入，极大增强了系统在嘈杂环境下的鲁棒性 。这种算法的突破，使得投喂决策系统可以根据摄食强度的量化分级进行毫秒级的反馈控制。

摄食强度量化级别

生物学特征表现

算法特征提取与传感器响应

管理决策转换

强 (Strong)

鱼群在食物间持续快速穿梭，对投入饵料瞬间抢食殆尽。

高频声学激波特征；密集且高模值的光流向量聚焦于投喂点；背景减除法呈现大面积高频变动。

维持当前最高投喂速率，系统判定处于最佳生长代谢窗口。

中 (Medium)

鱼类游动超过一个体长的距离进行摄食，随后返回原始水层。

声学信号呈现间歇性峰值；视频序列中呈现中等速度的空间位移，群体离散度（Ptot）适中。

降低投喂频率或减少单次投喂量，准备进入摄食饱和期。

弱 (Weak)

仅摄食直接落于前方的颗粒，几乎无主动觅食位移。

极低振幅的声波扰动；光学掩膜变动微小，时空特征网络输出低活跃度权重。

立即停止投喂，防止残饵沉积导致氨氮及生化需氧量（BOD）激增。

### 1.2 低氧应激反应与异常行为的实时监测

低氧是高密度养殖中最致命的物理环境胁迫之一。当溶解氧低于临界阈值时，鱼类会表现出减少游动、体表浮头、丧失平衡等典型应激行为，并在生理上发生向无氧糖酵解的代谢转变 。对于养殖管理者而言，早期预警这些异常行为至关重要。

然而，在真实的水产养殖环境中，光照变化、水体浑浊以及鱼体之间的严重遮挡，使得传统目标检测模型难以精准捕捉鱼类的低氧浮头行为。为此，2025年Cai等人对现有模型进行了深度改造，提出了 YOLOv8n-HSB 等实时检测架构 。该架构的核心创新在于：第一，引入多尺度融合金字塔网络（MFP-Net），通过改进双向特征金字塔网络（BiFPN）结构，极大地增强了对水面微小目标的检测能力；第二，在骨干网络中开发了 C2f-遮挡感知模块，融合了移动倒置瓶颈卷积和有效的通道注意力机制，提升了对密集鱼群局部特征的捕获；第三，采用参数化动态卷积（P-DConv）替换传统卷积层，使得在复杂环境下的检测精度达到了 96.12% 。

这些异常行为检测不仅用于报警，更被集成到多目标环境调控系统中。例如，Li Daoliang 团队将 YOLOv8s-FasterNet 识别出的行为反馈与特定生长率模型和能源成本模型相结合，形成动态曝气控制策略。这种基于实际生物反应的灵活控制，不仅确保了鱼类的动物福利（降低皮质醇和氧化应激水平），其经济收益更是传统静态阈值控制方案的数倍 。

## 二、水下计算机视觉与基石算法构建——走向“AquaOS”平台的系统化路径

如果要建立一个包含“鱼虾蟹图像数据库 + AI 识别模型 + 健康评分系统”的“WaterDoctor”智能诊断平台，其底层必须依赖极端鲁棒的水下计算机视觉（Underwater Computer Vision）算法。与陆地环境不同，水下光传输受到严重的吸收和散射影响，导致图像对比度低、颜色严重偏移（偏蓝或偏绿）以及严重的后向散射噪声。很多学者和我们团队也都正在从算法底层和数据集构建两个维度攻克这一难题。

### 2.1 水下图像增强与机器视觉效用评估

水下图像增强是后续所有目标检测和分割任务的先决条件。郑海永和李娟团队在这一领域做出了系统性的贡献。由于缺乏成对的高质量真实水下数据集，传统依赖合成数据的生成对抗网络（GAN）或扩散模型在现实部署中往往面临严重的域偏移（Domain Shift）问题 。该团队提出的 Water-Net 架构以及后续的 USGFormer（基于 Transformer 和结构引导的增强网络）代表了当前的先进水平 。