API 速查表
本表是项目最有价值的资产之一——基于站长考试经验整理。完整版含图解和示例。
通用考试策略
必记
题目不提供代码框架,只需背诵 import 语句和核心 API 调用。
详见 import 速查。
数据预处理(对应 1.1.x、2.1.x,约 40 分)
| 场景 | 核心 API |
|---|---|
| 数据读取 | pd.read_csv()、pd.read_excel() |
| 数据理解 | print(data.head())、data.shape、len(data)、data.info() |
| 数据生成与转换 | np.where()、pd.cut()、pd.get_dummies()、df['列名'].apply() |
| 数据计算与分组 | value_counts()、data.groupby().agg() |
| 数据检查与清洗 | .isnull().sum()、.duplicated().sum()、fillna()、data.drop()、dropna()、data.rename() |
| 条件筛选 | isin()、.between() |
| 类型转化 | astype()、pd.to_numeric() |
| 标准化与异常值处理 | .mean()、.std()、.quantile()、scaler.fit_transform() |
| 数据集分割与保存 | train_test_split()、pd.concat()、data.to_csv() |
| 绘图 | data.plot(kind='bar')、data.plot.pie()、plt.scatter() |
建模(对应 2.2.x,20 分)
| 场景 | 核心 API |
|---|---|
| 模型定义与训练 | LogisticRegression、RandomForestRegressor、xgb.XGBRegressor、model.fit()、.dump() |
| 预测与样本平衡 | model.predict()、smote.fit_resample() |
| 模型评估 | model.score()、mean_squared_error()、r2_score() |
图像识别(对应 3.2.x,20 分)
| 场景 | 核心 API |
|---|---|
| 模型加载 | ort.InferenceSession() |
| 图像处理 | Image.open().convert()、cv2.imread()、image.resize()、np.asarray()、np.expand_dims() |
| 模型应用与输出 | session.get_inputs()、session.run()、scipy.special.softmax()、np.argsort()、np.argmax() |
| 结果处理与文件操作 | list(emotion_table.keys())、open('labels.txt', 'r')、accuracy[0, predicted_idx] * 100、name.strip()、makedirs() |