-
•
Parquet vs Apache ORC
-
•
import sys
from pyspark.sql import SparkSession, Row
from pyspark.sql.function import col, from_json, when, expr, struct, lit, concat, md5, regexp_replace, udf
from pyspark.sql.types import *
import py_psql
-
•
CKA 자격증 취득 후기
-
•
'''
https://en.wikipedia.org/wiki/Two%27s_complement
-
•
Database Internals 책을 1회독 한 후 머리속에 남은 것이 없어 2회독으로 하며 정리해보고자 작성하는 포스팅.
데이터 엔지니어를 목표로 하는 비전공자에게 피가되고 살이 되는 필독서이지 않을까… 싶다
-
•
scheduler 노드 지정
apiVersion: v1
kind: Pod
metadata:
name: nginx
spec:
nodeName: control
containers:
image: nginx
name: nginx
-
•
```python
abs(num) # 절댓값
pow(4, 2) # 4^2
max(5, 12) # 12
min(5, 12) # 5
round(3.14) # 3 default가 0
-
•
Two Sum
https://leetcode.com/problems/two-sum/submissions/1090599733/
-
•
Oracle to KUDU CDC를 구현하면서… Apache Kudu table에 반드시 필요한 PK로 사용하다가, 관련 에러가 발생해 Oracle rowid를 공부하고 내용을 정리해본다…
-
•
Python을 통해 Oracle 테이블을 핸들링하기 위한 Python Package로 cx_Oracle을 사용이 가능하다.
본인은, oracle table을 Apache Kudu에 이관하기 위해서 cx_Oracle을 사용했다.