fenghuo/packages/storage/docs/S3_DOWNLOAD_MECHANISM.md

# S3存储下载机制说明

## 问题背景

在文件上传系统中，我们使用了两种存储类型：

- **本地存储（Local）**：文件存储在服务器本地文件系统
- **S3存储（S3）**：文件存储在AWS S3或兼容的对象存储服务中

对于文件访问，我们使用了目录格式的 `fileId`，例如：`2025/05/28/RHwt8AkkZp`

## 存储结构差异

### 本地存储

- **fileId**：`2025/05/28/RHwt8AkkZp` （目录路径）
- **实际存储**：`/uploads/2025/05/28/RHwt8AkkZp/filename.ext`
- **下载方式**：扫描目录，找到实际文件，返回文件流

### S3存储

- **fileId**：`2025/05/28/RHwt8AkkZp` （目录路径）
- **S3 Key**：`2025/05/28/RHwt8AkkZp/filename.ext` （完整对象路径）
- **下载方式**：重定向到S3 URL

## 核心问题

S3存储中，对象的完整路径（S3 Key）包含文件名，但我们的 `fileId` 只是目录路径，缺少文件名部分。

## 解决方案

### 1. 文件名重建策略

我们通过以下方式重建完整的S3路径：

```typescript
const fileName = resource.title || 'file';
const fullS3Key = `${fileId}/${fileName}`;
```

### 2. URL生成逻辑

```typescript
// AWS S3
const s3Url = `https://${bucket}.s3.${region}.amazonaws.com/${fullS3Key}`;

// 自定义S3兼容服务（如MinIO）
const s3Url = `${endpoint}/${bucket}/${fullS3Key}`;
```

### 3. 下载流程

1. 从数据库获取文件信息（fileId + resource.title）
2. 重建完整S3 Key：`${fileId}/${fileName}`
3. 生成S3直接访问URL
4. 302重定向到S3 URL，让客户端直接从S3下载

## 优势

### 性能优势

- **302重定向**：避免服务器中转，减少带宽消耗
- **直接下载**：客户端直接从S3下载，速度更快
- **CDN友好**：可配合CloudFront等CDN使用

### 安全考虑

- **公开读取**：需要确保S3 bucket配置了适当的公开读取权限
- **预签名URL**：未来可扩展支持预签名URL用于私有文件

## 局限性

### 文件名依赖

- 依赖数据库中存储的 `resource.title` 字段
- 如果文件名不匹配，会导致404错误

### 替代方案

如果需要更可靠的方案，可以考虑：

1. **存储完整S3 Key**：在数据库中存储完整的S3对象路径
2. **S3 ListObjects API**：动态查询S3中的实际对象（会增加API调用成本）

## 环境配置

确保S3配置正确：

```env
STORAGE_TYPE=s3
S3_BUCKET=your-bucket-name
S3_REGION=us-east-1
S3_ACCESS_KEY_ID=your-access-key
S3_SECRET_ACCESS_KEY=your-secret-key
S3_ENDPOINT=https://s3.amazonaws.com  # 可选，用于其他S3兼容服务
```

## 测试验证

使用以下URL格式测试下载：

```
/download/2025%2F05%2F28%2FRHwt8AkkZp
```

应该会302重定向到：

```
https://your-bucket.s3.us-east-1.amazonaws.com/2025/05/28/RHwt8AkkZp/filename.ext
```