手写汉字识别

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset
import os
from PIL import Image
import torchvision.transforms as transforms

自定义数据集类
class CustomDataset(Dataset):
def init(self, data_directory, transform=None):
self.data_directory = data_directory
self.transform = transform
self.classes = os.listdir(data_directory)
self.class_to_idx = {cls: i for i, cls in enumerate(self.classes)}
self.samples = []
for cls in self.classes:
cls_dir = os.path.join(data_directory, cls)
for img_name in os.listdir(cls_dir):
img_path = os.path.join(cls_dir, img_name)
self.samples.append((img_path, self.class_to_idx[cls]))

def len(self):
return len(self.samples)

def getitem(self, idx):
img_path, label = self.samples[idx]
image = Image.open(img_path).convert('RGB')
if self.transform:
image = self.transform(image)
return image, label
定义模型（以简单的CNN为例）
class SimpleCNN(nn.Module):
def init(self, num_classes):
super(SimpleCNN, self).init()
self.conv1 = nn.Conv2d(3, 16, kernel_size=3, padding=1)
self.relu1 = nn.ReLU()
self.pool1 = nn.MaxPool2d(kernel_size=2, stride=2)
self.conv2 = nn.Conv2d(16, 32, kernel_size=3, padding=1)
self.relu2 = nn.ReLU()
self.pool2 = nn.MaxPool2d(kernel_size=2, stride=2)
self.fc = nn.Linear(32 * 8 * 8, num_classes) # 假设输入图像是32x32，可根据实际图像尺寸调整

def forward(self, x):
x = self.pool1(self.relu1(self.conv1(x)))
x = self.pool2(self.relu2(self.conv2(x)))
x = x.view(x.size(0), -1)
x = self.fc(x)
return x
训练、验证、测试函数
def train_validate_test(data_directory, epochs=50):

数据预处理

train_transform = transforms.Compose([
transforms.Resize((32, 32)),
transforms.RandomHorizontalFlip(),
transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])
test_transform = transforms.Compose([
transforms.Resize((32, 32)),
transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

假设数据目录下有train和test文件夹，可根据实际目录结构调整

train_dataset = CustomDataset(os.path.join(data_directory, 'train'), transform=train_transform)
test_dataset = CustomDataset(os.path.join(data_directory, 'test'), transform=test_transform)

train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)

num_classes = len(train_dataset.classes)
model = SimpleCNN(num_classes)
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

学习率调度器（移除verbose参数）

scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.5, patience=5)

class_mapping = train_dataset.class_to_idx

训练循环

for epoch in range(epochs):
model.train()
running_loss = 0.0
for inputs, labels in train_loader:
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
running_loss += loss.item()
print(f'Epoch {epoch+1}, Train Loss: {running_loss/len(train_loader):.3f}')

# 验证（此处可添加验证逻辑，若有验证集的话）
model.eval()
val_loss = 0.0
with torch.no_grad():
    for inputs, labels in test_loader:  # 若有验证集，需替换为验证集loader
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        val_loss += loss.item()
scheduler.step(val_loss)  # 根据验证损失调整学习率
print(f'Epoch {epoch+1}, Val Loss: {val_loss/len(test_loader):.3f}')

测试

model.eval()
correct = 0
total = 0
with torch.no_grad():
for inputs, labels in test_loader:
outputs = model(inputs)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
test_accuracy = 100 * correct / total
print(f'Test Accuracy: {test_accuracy:.2f}%')

return class_mapping, test_accuracy
调用函数
data_directory = 'D:/pytorch/shuzi' # 替换为你的数据目录
class_mapping, test_accuracy = train_validate_test(data_directory, epochs=50)
print("Class Mapping:", class_mapping)
print("Test Accuracy:", test_accuracy)

posted @ 2025-11-09 21:05 magixx 阅读(7) 评论(0) 收藏举报

刷新页面返回顶部

Melody0714

手写汉字识别

数据预处理

假设数据目录下有train和test文件夹，可根据实际目录结构调整

学习率调度器（移除verbose参数）

训练循环

测试

公告