文章 2024-12-21 来自:开发者社区

LEC: 基于Transformer中间层隐藏状态的高效特征提取与内容安全分类方法

随着语言模型(LMs)应用范围的扩大,对用户输入和模型输出中不当内容的检测变得日益重要。每当主要模型供应商发布新模型时,研究人员首先会尝试寻找绕过模型安全限制的方法,使其产生不符合预期的响应。通过Google的搜索可以发现,已有多种方法可以绕过模型的对齐调整,导致模型对不当请求作出响应。另外多家公司已将基于生成式AI的对话系统应用于客户服务等场景,这些系统经常面临提示注入攻击,导致其响应不当请求....

LEC: 基于Transformer中间层隐藏状态的高效特征提取与内容安全分类方法
问答 2024-06-30 来自:开发者社区

阿里云安全内容安全的OSS违规检测中,有什么参数或方法能将检测出来的违规图片直接删除吗?

阿里云安全内容安全的OSS违规检测中,有什么参数或方法能将检测出来的违规图片直接删除吗?

阿里云文档 2024-04-22

调用/green/video/manual/asyncScan进行人工审核的方法

本文介绍了调用视频人工审核接口(/green/video/manual/asyncScan)进行人工审核的方法。内容安全除了提供机器识别服务外,还提供纯人工审核服务,如果您对识别结果的准确率和召回率要求非常高,请使用人工审核功能。

问答 2024-04-06 来自:开发者社区

阿里云安全内容安全增强版好像不能字节数组图片审核了,除了上传oss,还有其他方法审核私网图片嘛?

阿里云安全内容安全增强版好像不能字节数组图片审核了,除了上传oss,还有其他方法审核私网图片嘛?

阿里云文档 2023-12-20

调用文件检测接口检测文件内容的方法_内容安全1.0_内容安全(Content Moderation)

文件检测能够提取各类文件中的图片和文字内容,进行内容安全检测。文件检测除了支持解析文件内容,还可以在解析过程中将文件同步转成图片,并结合图片检测、图片OCR等方式,实现更全面的保障文件内容合规性。本文介绍如何调用文件检测接口检测文件内容的方法。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云安全

让上云更放心,让云上更安全。

+关注