随着人工智能技术的不断发展,人工智能医疗器械在医疗领域的应用越来越广泛。肺部影像辅助分析软件作为一种人工智能医疗器械,可以对肺部影像进行自动分析和诊断,提高医生的诊断准确性和效率。然而,肺部影像辅助分析软件的算法性能直接影响其诊断准确性和可靠性,因此需要进行算法性能测试。
YY/T 1858-2022 标准规定了肺部影像辅助分析软件的算法性能测试方法。该标准要求测试环境应符合相关要求,包括测试设备、测试软件、测试数据等。测试设备应符合相关标准,测试软件应具有可重复性和可比性,测试数据应具有代表性和充分性。
测试数据是算法性能测试的关键,YY/T 1858-2022 标准要求测试数据应包括正常肺部影像和异常肺部影像,且应具有代表性和充分性。测试数据的来源可以是公开数据集或者医院内部数据集,但需要保证数据的质量和隐私安全。
YY/T 1858-2022 标准还规定了测试指标,包括准确率、召回率、F1值等。准确率是指算法正确识别的肺部影像占总肺部影像的比例,召回率是指算法正确识别的肺部影像占实际异常肺部影像的比例,F1值是准确率和召回率的调和平均数。测试流程包括数据预处理、算法测试、结果分析等步骤,需要保证测试流程的可重复性和可比性。
相关标准
GB/T 191-2008 标准化工作导则
YY/T 1632-2018 人工智能医疗器械 术前手术规划软件 术前评估性能测试方法
YY/T 1633-2018 人工智能医疗器械 术中手术辅助软件 术中性能测试方法
YY/T 1857-2022 人工智能医疗器械 肺部影像辅助分析软件 技术要求和测试方法
YY/T 1859-2022 人工智能医疗器械 心电图自动分析软件 算法性能测试方法