一、简介
tochvision主要处理图像数据,包含一些常用的数据集、模型、转换函数等。torchvision独立于PyTorch,需要专门安装。
2025年10月19日
tochvision主要处理图像数据,包含一些常用的数据集、模型、转换函数等。torchvision独立于PyTorch,需要专门安装。
2025年10月19日
深度学习领域最迷人的生成模型之一,不仅能重构数据,更能创造新内容。
变分自编码器(Variational Autoencoder,VAE)作为深度学习领域一种强大的生成模型,近年来在人工智能生成内容(AIGC)领域展现出巨大潜力。
2025年10月19日
缺失数据处理一直是机器学习实践中的难点。MICE(Multivariate Imputation by Chained Equations)作为一种基于迭代思想的插补框架,可以处理复杂缺失值问题。因为它不是简单地用均值或中位数填补空缺,而是通过构建后验分布来建模不确定性,这种处理方式在统计学上更为严谨。
但MICE的学习曲线优点陡峭,迭代机制和模型依赖特性也让不少人望而却步,所以本文会通过PMM(Predictive Mean Matching)和线性回归等具体方法,拆解MICE的工作原理,同时对比标准回归插补作为参照。
2025年10月19日
依赖安装注意点:版本要匹配(
https://github.com/openvinotoolkit/nncf/blob/develop/docs/Installation.md),否则会有很多坑
import nncf
import openvino as ov
from paddle.io import DataLoader
from dataset import SimpleDataSet, DecodeImage, DetResizeForTest, NormalizeImage, ToCHWImage, KeepKeys
def transform_fn(data_item):
# images, _ = data_item
return data_item[0]
def quantization(model_path, output_path):
model = ov.Core().read_model(model_path)
transforms = [ # 以一个文本检测任务为例,基于paddleocr训练的模型
DecodeImage(img_mode='BGR',
channel_first=False),
DetResizeForTest(image_shape=[640, 640]),
NormalizeImage(scale=1. / 255.,
mean=[0.485, 0.456, 0.406],
std=[0.229, 0.224, 0.225],
order='hwc'),
ToCHWImage(),
KeepKeys(keep_keys=['image', 'shape'])
]
val_dataset = SimpleDataSet(
data_dir='D:/datasets/hukouben_crop_direction',
label_file_list='D:/datasets/hukouben_crop_direction/text_det/Label.txt',
do_shuffle=False,
mode='val',
ratio_list=[1],
delimiter='\t',
transforms=transforms,
seed=None
)
data_loader = DataLoader(val_dataset, batch_size=1)
calibration_dataset = nncf.Dataset(data_loader, transform_fn)
quantized_model = nncf.quantize(model, calibration_dataset)
ov.save_model(quantized_model, output_path)
if __name__ == '__main__':
model_path = 'hukouben_text_det_mv3_db++.onnx' # onnx模型路径
output_path = './output/ser_640_640_model_quant.xml' # openvino模型保存路径
quantization(model_path, output_path)
2025年10月19日
(K折、留一,留p,随机)
学习预测函数的参数,并在相同数据集上进行测试是一种错误的做法: 一个仅给出测试用例标签的模型将会获得极高的分数,但对于尚未出现过的数据它则无法预测出任何有用的信息。 这种情况称为 overfitting(过拟合). 为了避免这种情况,在进行(监督)机器学习实验时,通常取出部分可利用数据作为 test set(测试数据集) X_test, y_test。
利用 scikit-learn 包中的 train_test_split 辅助函数可以很快地将实验数据集划分为任何训练集(training sets)和测试集(test sets)。
2025年10月19日
北京精加至信医疗科技有限公司报告,由于牙科种植体系统Implant system,基台Abutment经抽检不符合相关产品技术要求,生产商硕月医疗株式会社SDM Co., Ltd对其生产的牙科种植体系统Implant system(国械注进20153171003),基台Abutment(国械注进20223170100)主动召回。召回级别为二级召回。涉及产品的型号、规格及批次等详细信息见《医疗器械召回事件报告表》。
附件:
《医疗器械召回事件报告表》.pdf
2025年10月19日
时光从周秦汉唐的烟尘里蜿蜒而来,无声淌过三秦大地的沟壑与平原,将千年风霜、万里烟霞一同酿入岁月的酒坛,沉淀成一壶醇厚绵长的老酒。
我立于明城墙的垛口,指尖轻触砖石上的斑痕,粗糙的触感顺着指尖蔓延至心底,仿佛触到了历史的脉搏——那是无数个朝代兴衰时留下的心跳。
每道裂纹都如老者额头的褶皱,在风里雨里低低诉说着过往:或许是盛唐时驼队的蹄声,或许是乱世里戍卒思乡的叹息,也或许是晨雾中
2025年10月19日
王迈:绮罗
2025.7.26-9.15
颂艺术中心
站在颂艺术中心展厅,“王迈:绮罗”的金箔丝线在荧光炫色中流转,画中“数据流体”与镜中倒影重叠。这让我想起2012年UCCA尤伦斯当代艺术中心展厅的《石油怪兽》,那是桦木骨架刺破资本幻梦,笔杆握在手里像利剑;而今金线缠绕的,是每个在算法中呼吸的普通人的肉身。
王迈《宝贝No.1》2025
个体是怎么变成金线的