[패스트캠퍼스 챌린지 22일차] Feature 추출 및 추론
오늘은 다음의 학습목표에 집중하자!
1. Store 로부터 훈련 데이터 추출하기
2. Online Store 로 데이터를 적재하고 추론을 위한 Feature Vector 가져오기
강의에 파이썬 강의도 같이 연계되어 있으면 좋겠다... 또르륵
Store 로부터 훈련 데이터 추출하기
- 훈련 데이터 추출
- get_historical_features 로 데이터 추출
Online Store 로 데이터를 적재하고 추론을 위한 Feature Vector 가져오기
- Online Store 로 데이터 적재
- Serving 을 하기 위해 materialize-incremental 명령어를 사용하여 가장 최근 실행된 materialize 이후의 모든 새로운 feature 값들을 serialization 시켜 준다.
from datetime import datetime
!feast materialize-incremental {datetime.now().isoformat()}
- materialized features 확인
print("--- Data directory ---")
!ls data
import sqlite3
import pandas as pd
con = sqlite3.connect("data/online_store.db")
print("\n--- Schema of online store ---")
print(
pd.read_sql_query(
"SELECT * FROM feature_repo_driver_hourly_stats", con).columns.tolist())
con.close()
- 추론을 위한 Feature Vector 가져오기
- get_online_features 로 데이터 추출
from pprint import pprint
from feast import FeatureStore
store = FeatureStore(repo_path=".")
feature_vector = store.get_online_features(
features=[
"driver_hourly_stats:conv_rate",
"driver_hourly_stats:acc_rate",
"driver_hourly_stats:avg_daily_trips",
],
entity_rows=[
{"driver_id": 1004},
{"driver_id": 1005},
],
).to_dict()
pprint(feature_vector)
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.
패스트캠퍼스 바로가기: https://bit.ly/37BpXiC