Google Cloud Storage ์ฐ๋
AWS S3 ์ฐ๋ ๊ธฐ๋ฅ๊ณผ ๋ณธ์ง์ ์ผ๋ก ๋์ผํ ๊ธฐ๋ฅ์ด๋ฉฐ, Raw Data๋ฅผ Dumpํ๋ ํ๊ฒ์ด Google Cloud Storage ์ ๋๋ค. Google Cloud Storage ์ฐ๋ ๊ธฐ๋ฅ์ ์์ด๋ธ๋ฆฟ์ง ๋์๋ณด๋์์ ์ง์ํ๊ณ ์์ง ์์ต๋๋ค. Google Cloud Storage ์ฐ๋์ด ํ์ํ์ ๋ถ๋ค์ ์๋ ๋ฌธ์๋ฅผ ์ฝ๊ณ , ๋ด๋น CSM์๊ฒ ์์ฒญ ๋ฉ์ผ์ ๋ณด๋ด์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.
๋ชฉํ
Airbridge์์ ์ ๊ณตํ๋ Raw Data(Tracking Link, Web, App)์ Google Cloud Storage๋ก ๋งค์ผ ๋คํ ๋ฐ์ต๋๋ค.
๋ฐฉ๋ฒ
1. GCP Service Accounts ๋ง๋ค๊ธฐ
1-1) IAM > Service Accounts ๋ฉ๋ด์ ๋ค์ด๊ฐ๋๋ค.
1-2) + Create Service Account
๋ฅผ ๋๋ฌ ์๋ก์ด Service Account๋ฅผ ์์ฑํฉ๋๋ค.
1-3) ์์ฑํ Service Account์ ํค๋ฅผ ๋ง๋ค๊ณ (Add Key), JSON ํ์์ผ๋ก ๋ค์ด๋ก๋ ๋ฐ์ต๋๋ค.
2. Bucket ๋ง๋ค๊ณ , ๊ถํ ๋ถ์ฌํ๊ธฐ
2-1) Storage Browser ๋ฉ๋ด์์ ์๋ก์ด ๋ฒํท(Create Bucket)์ ๋ง๋ญ๋๋ค.
2-2) ์์ฑํ ๋ฒํท์ Permissions ๋ฉ๋ด์ ๋ค์ด๊ฐ, + Grant Access
์ดํ 1-3)์์ ๋ค์ด๋ก๋ ๋ฐ์๋ JSON ํ์ผ์ ๋ค์ด์๋ client_email
์๊ฒ Storage Object Admin ๊ถํ์ ๋ถ์ฌํฉ๋๋ค.
3. Airbridge CSM์ ์ฐ๋ ์ ๋ณด ์ ๋ฌํ๊ธฐ
์๋ 3๊ฐ์ง ์ ๋ณด๋ฅผ CSM์๊ฒ ์ ๋ฌํฉ๋๋ค.
- 1-3)์์ ๋ค์ด๋ก๋ ๋ฐ์๋ JSON ํ์ผ ๋ด
client_email
- 1-3)์์ ๋ค์ด๋ก๋ ๋ฐ์๋ JSON ํ์ผ ๋ด
private_key
- 2-1)์์ ๋ง๋ค์๋ bucket ์ด๋ฆ
์ฐธ๊ณ ์ฌํญ
- ๋ฐ์ดํฐ ๋คํ๋ ์๋์ ๊ฒฝ๋ก์ ๋ฉ๋๋ค.
- ์น ์ด๋ฒคํธ:
{bucket_name}/{app_name}/web/{version}/date={YYYY-MM-DD}/
- ์ฑ ์ด๋ฒคํธ:
{bucket_name}/{app_name}/app/{version}/date={YYYY-MM-DD}/
- ํธ๋ํน๋งํฌ ์ด๋ฒคํธ:
{bucket_name}/{app_name}/tracking-link/{version}/date={YYYY-MM-DD}/
- ์น ์ด๋ฒคํธ:
- ์ฐ๋์ด ์๋ฃ๋ ์ดํ์๋ KST ๊ธฐ์ค ๋งค์ผ ์๋ฒฝ 4~6์ ์ฌ์ด ๋คํ๋ฉ๋๋ค.
- 128MB ํฌ๊ธฐ ์ดํ์ ํ์ผ์ด ์ฌ๋ฌ๊ฐ ๋คํ๋๋ฏ๋ก, ์ฌ๋ฌ๊ฐ ํ์ผ์ ๋ก๋ํ๊ธฐ ์ํ ์ฒ๋ฆฌ๋ฅผ ํด์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.
- Raw Data ์ปฌ๋ผ ์ ๋ณด๋ https://abit.ly/dataspec ๋ฅผ ์ฐธ๊ณ ํด์ฃผ์๊ธฐ ๋ฐ๋๋๋ค. ๋คํ ๋ฒ์ ์ ์ฐ๋ ์์ฒญ ์์ ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์์ต๋๋ค.(์์ฒญ ์์ ์ ์ต์ ๋ฒ์ ์ ๋คํํจ)
- Google Cloud Storage Console์์ ํ์ผ ๋ค์ด๋ก๋์
.csv.gz
ํ์ฅ์์ ํ์ผ์ด.csv
ํ์ฅ์๋ก ์ ํ๋์ด ๋ค์ด๋ก๋ ๋๋ ๊ฒฝ์ฐ๊ฐ ์์ต๋๋ค.(Console ๋ฒ๊ทธ๋ก ์ถ์ ๋จ) ์ด ๊ฒฝ์ฐ.csv
ํ์ฅ์๋ฅผ.csv.gz
๋ก ์ ํํด์ค ๋คgunzip
๋ฑ์ ๋ช ๋ น์ด๋ก gzip ์์ถ์ ํ๋ฉด csv ํ์ผ์ ํ์ธํ์ค ์ ์์ต๋๋ค.
Updated about 2 years ago