BigData

本文最后更新于 2026年5月26日晚上

Week1

这个主要就是 ER Model

记录一道类型题：

这个题的关键是 “Functional Determined”.

例如这道题的 1，2 小问，问题只包含了三个实体中的两个，而这样就不能 “Functional Determined”，因此都 correct。

但是在 3，4，5 小文中，因为三个实体被同时提及了，因此这之间就有关系了：Person & event determine the seat。

然后再根据线间的数字关系，进行作答。

注意点：

定义实体：[名字]:{[属性:类型]}

然后 Key Element 记得带下划线，和 ER 图一致

定义关系：[关系名]:{[来自操作实体的 Key Element。操作自身的 Attribute]}

分为两部分。一部分为操作实体的 Key，用来指定操作对象。另一部分是操作自身的 Attribute。用来提供相关信息。

1:N 与 1:1 关系的体现。
1:N：外键放到 N 的那一边。
1:1 外键放那边都可以，但不能都放。

记一个比较搞耍的事情：课上老师正儿八经认为拆那有 Social Score XD

基本语法：

SELECT column1,column2
FROM table1
JOIN table2
WHERE some_condition
GROUP BY some_column
HAVING some_property

然后基本逻辑相关：

1
2
3

OR AND IS NOT
-- NULL判断：
IS NULL

这一周主要是一些优化方法，简单的说就是：

“能提前筛选的就先筛，减少工作量”。

然后还有一个小点就是 Relation Algebra 里面选列 $\pi$ 默认是去重的，因为是 Set Semantics, 想要不去重，就得用 Bag Semantics, 可以显式指定。

#Data Science

BigData

https://chenxizhou233.github.io/posts/6694cda0.html

作者

Xizhou Chen

发布于

2026年4月9日

许可协议