์ฃผ์š” ์ปจํ…์ธ ๋กœ ์ด๋™

๋ฐ์ดํ„ฐ๋ธŒ๋ฆญ์Šค AutoML์„ ํ†ตํ•œ ์˜ˆ์ธก ๊ฐ„์†Œํ™”

automl-blog-og-1

๋ฐœํ–‰์ผ: 2024๋…„ 3์›” 4์ผ

๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค ๋ฐ MLLess than a minute

์ž‘์„ฑ์ž: Justin Kim , ๋ฃจ ์™•

Translated by HaUn Kim - Original Blog Post
ย 

์ž‘๋…„์—๋Š” ๋ถ„๋ฅ˜์™€ ํšŒ๊ท€๋ฅผ ์œ„ํ•œ ๋ฐ์ดํ„ฐ๋ธŒ๋ฆญ์Šค AutoML์ด๋ผ๋Š” ๋„๊ตฌ๋ฅผ ๋ฐœํ‘œํ•˜๋ฉฐ, ๋ฐ์ดํ„ฐ ํŒ€์˜ ์—ญ๋Ÿ‰ ๊ฐ•ํ™”์— ์žˆ์–ด '๋ธ”๋ž™ ๋ฐ•์Šค'๊ฐ€ ์•„๋‹Œ '์œ ๋ฆฌ ์ƒ์ž' ์ ‘๊ทผ ๋ฐฉ์‹์˜ ์ค‘์š”์„ฑ์„ ๊ฐ•์กฐํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ค๋Š˜์€ ์ด ๊ธฐ๋Šฅ์„ ์˜ˆ์ธก์šฉ AutoML๋กœ ํ™•์žฅํ•˜์—ฌ ์˜ˆ์ธก ๋ฌธ์ œ๊นŒ์ง€ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ธฐ์œ ์†Œ์‹์„ ์ „ํ•˜๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ ํŒ€์€ UI๋ฅผ ํ†ตํ•ด ์‰ฝ๊ฒŒ ์˜ˆ์ธก์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด ์ƒ์„ฑ๋œ ์˜ˆ์ธก์€ ๋ฐ”๋กœ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ์‹œ์ž‘์ ์œผ๋กœ ์‚ผ์•„ ์ถ”๊ฐ€์ ์œผ๋กœ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ฃผ๋กœ ์ดํ•ด๊ด€๊ณ„์ž๋“ค์ด ์ œํ’ˆ, ์ง€์—ญ, ๋งค์žฅ ๋“ฑ์— ๋”ฐ๋ผ ์ˆ˜๋ฐฑ, ์ˆ˜์ฒœ ๊ฐœ์˜ ๋‹ค์–‘ํ•œ ์˜ˆ์ธก์„ ๊ฒ€ํ† ํ•ด์•ผ ํ•˜๋Š” ์ƒํ™ฉ์—์„œ ์ค‘์š”ํ•œ๋ฐ, ์•„์ง ์‹œ์ž‘ํ•˜์ง€ ์•Š์€ ์˜ˆ์ธก์˜ ๋ฐฑ๋กœ๊ทธ๊ฐ€ ์Œ“์ผ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์˜ˆ์ธก์—์„œ๋Š” ์‹œ์ž‘ ์‹œ๊ฐ„์„ ๋‹จ์ˆœํ™”ํ•˜๊ณ  ๋‹จ์ถ•ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ์ธก์šฉ AutoML์€ ๋ฐ์ดํ„ฐ ํŒ€์„ ์ง€์›ํ•˜์—ฌ ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์˜ ์˜ˆ์ธก๋ ฅ์„ ์‹ ์†ํ•˜๊ฒŒ ๊ฒ€์ฆํ•˜๊ณ  ์˜ˆ์ธก ํ”„๋กœ์ ํŠธ์˜ ๋ฐฉํ–ฅ์„ ์•ˆ๋‚ดํ•˜๋Š” ๊ธฐ์ค€ ๋ชจ๋ธ์„ ์–ป์„ ์ˆ˜ ์žˆ๋„๋ก ๋„์™€์ค๋‹ˆ๋‹ค.

์ด์ œ AutoML์„ ํ†ตํ•ด ์–ผ๋งˆ๋‚˜ ์‰ฝ๊ฒŒ ์˜ˆ์ธก์„ ์–ป์„ ์ˆ˜ ์žˆ๋Š”์ง€ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

์˜ˆ์‹œ: ์‚ฌํƒ• ์ƒ์‚ฐ๋Ÿ‰ ์˜ˆ์ธก

๋ฐœ๋ Œํƒ€์ธ๋ฐ์ด๊ฐ€ ๋‹ค๊ฐ€์˜ค๋ฉด์„œ ์•ž์œผ๋กœ ๋ช‡ ์ฃผ ๋™์•ˆ์˜ ์‚ฌํƒ• ์ƒ์‚ฐ๋Ÿ‰์„ ์˜ˆ์ธกํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค.ย 

์ž‘๋™ ๋ฐฉ๋ฒ•ย 

์„ค์ • ๋งˆ๋ฒ•์‚ฌ๊ฐ€ ์‹œ์ž‘ํ•˜๊ธฐ ์ „์— ๊ตฌ์„ฑํ•ด์•ผ ํ•  ์‚ฌํ•ญ์„ ์•ˆ๋‚ดํ•ฉ๋‹ˆ๋‹ค. '์˜ˆ์ธก' ๋ฌธ์ œ ์œ ํ˜•์„ ์„ ํƒํ•˜๊ณ  ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์„ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ณธ ์˜ˆ์ œ์—์„œ๋Š” Databricks ๋ฐ Databricks Runtime 10.3์—์„œ ์ด๋ฏธ ํ…Œ์ด๋ธ”๋กœ ์ƒ์„ฑ๋œ ์‚ฌํƒ• ์ƒ์‚ฐ๋Ÿ‰ ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์„ ์‚ฌ์šฉํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋‹จ๋ณ€๋Ÿ‰ ์˜ˆ์ธก์„ ์ˆ˜ํ–‰ํ• ์ง€ ์•„๋‹ˆ๋ฉด ๋‹ค์ค‘ ๊ณ„์—ด ์˜ˆ์ธก์„ ์ˆ˜ํ–‰ํ• ์ง€๋„ ์ง€์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Follow the setup wizard to easily create your AutoML experiment

AutoML์ด ์‹คํ–‰๋˜๋ฉด, ํ•„์š”ํ•œ ๋ชจ๋“  ๋ฐ์ดํ„ฐ ์ค€๋น„๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ณ  Prophet ๋ฐ ARIMA ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ™œ์šฉํ•ด ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์˜ˆ์ธก ๋Œ€์ƒ ๊ฐ ์‹œ๊ณ„์—ด์— ๋Œ€ํ•ด Hyperopt๋ฅผ ์ด์šฉํ•˜์—ฌ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹์„ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๋ชจ๋“  ๊ณผ์ •์€ Apache Sparkโ„ข๋ฅผ ํ†ตํ•ด ์™„์ „ํžˆ ๋ณ‘๋ ฌ๋กœ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. AutoML์˜ ์‹คํ–‰์ด ๋๋‚˜๋ฉด, ํ•™์Šต๋œ ์—ฌ๋Ÿฌ ๋ชจ๋ธ๊ณผ ๊ทธ๋“ค์˜ ์„ฑ๋Šฅ ๋ฉ”ํŠธ๋ฆญ(์˜ˆ: SMAPE ๋ฐ RMSE)์„ ํ™•์ธํ•˜์—ฌ ๊ฐ€์žฅ ์ ํ•ฉํ•œ ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ย 

๋ฐ์ดํ„ฐ ํŒ€ ๊ฐ•ํ™”ํ•˜๊ธฐย 

๋‹ค์Œ์œผ๋กœ, AutoML์ด 'ํ˜ผํ•ฉ'์ด๋ผ๋Š” ์‚ฌํƒ• ์ข…๋ฅ˜์— ๋Œ€ํ•œ ์˜ˆ์ธก์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์„ ๊ฐ์ง€ํ•˜๊ณ  ๊ฒฝ๊ณ ๋ฅผ ํ†ตํ•ด ์•Œ๋ ค์ฃผ๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

AutoML transparently shows you alerts on important steps that were performed in the modeling

AutoML์˜ ๊ฐ€์žฅ ํฐ ์žฅ์  ์ค‘ ํ•˜๋‚˜๋Š” ๊ทธ ํˆฌ๋ช…์„ฑ์ž…๋‹ˆ๋‹ค. AutoML์€ ์ˆ˜ํ–‰๋œ ๋˜๋Š” ๊ฑด๋„ˆ๋›ด ์ค‘์š”ํ•œ ๋‹จ๊ณ„์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜์œผ๋กœ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๊นŠ์€ ์ดํ•ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ํ•„์š”ํ•œ ๋ชจ๋ธ ์—…๋ฐ์ดํŠธ๋ฅผ ์ง„ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

AutoML์„ ์‚ฌ์šฉํ•˜๋ฉด, ํ•™์Šต๋œ ๊ฐ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์™„์ „ํ•œ Python ๋…ธํŠธ๋ถ๊ณผ ๋ฐ์ดํ„ฐ ํƒ์ƒ‰ ๋…ธํŠธ๋ถ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ ํƒ์ƒ‰ ๋…ธํŠธ๋ถ์€ ๋ชจ๋ธ์— ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์ธ์‚ฌ์ดํŠธ๋ฅผ ๊ฐ•์กฐํ•˜์—ฌ, ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ž‘์—…์„ ๋”์šฑ ์‰ฝ๊ฒŒ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, 'ํ˜ผํ•ฉ'์ด๋ผ๋Š” ์‚ฌํƒ• ์œ ํ˜•์„ ๋ฐ์ดํ„ฐ ํƒ์ƒ‰ ๋…ธํŠธ๋ถ์—์„œ ์ œ๊ฑฐํ•˜๋”๋ผ๋„, ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ๊ฐ€ ๋‘ ๊ฐœ๋ฟ์ด์–ด์„œ ๊ทธ ์˜ํ–ฅ์ด ์˜ˆ์ธก์— ํฌ๊ฒŒ ๋ฏธ์น˜์ง€ ์•Š์Œ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Automatically generated data exploration notebooks allow you to quickly understand your data

์ด ๋…ธํŠธ๋ถ๋“ค์€ ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธํ‹ฐ์ŠคํŠธ๊ฐ€ ์ž์‹ ์˜ ์ „๋ฌธ ์ง€์‹์„ ํ™œ์šฉํ•˜์—ฌ ์ž๋™ ์ƒ์„ฑ๋œ ๋ชจ๋ธ์„ ์—…๋ฐ์ดํŠธํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋ฏ€๋กœ, ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธํ‹ฐ์ŠคํŠธ์—๊ฒŒ๋Š” ์•„์ฃผ ์ข‹์€ ์‹œ์ž‘์ ์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์˜ˆ์ƒ ์‚ฌํƒ• ์ƒ์‚ฐ๋Ÿ‰์„ ํ™•์ธํ•˜๋ ค๋ฉด, ๊ฐ€์žฅ ์„ฑ๋Šฅ์ด ์ข‹์€ ๋ชจ๋ธ์˜ ๋…ธํŠธ๋ถ์„ ์„ ํƒํ•˜๊ณ , 2022๋…„ 1์›”๋ถ€ํ„ฐ 3์›”๊นŒ์ง€์˜ ์˜ˆ์ธก์น˜๋ฅผ ํฌํ•จํ•œ ์‹ค์ œ ์‚ฌํƒ• ์ƒ์‚ฐ๋Ÿ‰๊ณผ ์˜ˆ์ธก์น˜๋ฅผ ๋น„๊ตํ•œ ๊ทธ๋ž˜ํ”„๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

The model notebooks include a view of your forecasts in context of your actual data

AutoML ์˜ˆ์ธก์€ ๋‹จ์ˆœํžˆ ์˜ˆ์ธก์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ ์™ธ์—๋„ ๋…ธํŠธ๋ถ์—์„œ ์˜ˆ์ธก์— ๋Œ€ํ•œ ๋” ๊นŠ์€ ๋ถ„์„์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ์˜ˆ์ธก์— ์–ด๋–ป๊ฒŒ ํŠธ๋ Œ๋“œ์™€ ๊ณ„์ ˆ์„ฑ์ด ๋ฐ˜์˜๋˜์—ˆ๋Š”์ง€๋ฅผ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ „๋ฐ˜์ ์œผ๋กœ ์‚ฌํƒ• ์ƒ์‚ฐ๋Ÿ‰์€ ํ• ๋กœ์œˆ๊ณผ ์—ฐ๋ง์—ฐ์‹œ์— ๋งž์ถฐ 10์›”๋ถ€ํ„ฐ 12์›”๊นŒ์ง€ ์ฆ๊ฐ€ํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์œผ๋ฉฐ, ๋ฐœ๋ Œํƒ€์ธ๋ฐ์ด๋ฅผ ๋งž์•„ 2์›”์—๋Š” ๋‹ค์‹œ ์•ฝ๊ฐ„ ์ƒ์‚ฐ๋Ÿ‰์ด ์ฆ๊ฐ€ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

Get additional insights about the generated forecasts

์ด์ œ ์‚ฌ์šฉํ•  ๋ชจ๋ธ์„ ์ฐพ์•˜์œผ๋‹ˆ, ์‹คํ–‰ ๋ชฉ๋ก์—์„œ ๋ชจ๋ธ ์ด๋ฆ„์ด๋‚˜ ์‹œ์ž‘ ์‹œ๊ฐ„์„ ํด๋ฆญํ•œ ๋‹ค์Œ '๋ชจ๋ธ ๋“ฑ๋ก' ๋ฒ„ํŠผ์„ ํด๋ฆญํ•˜์—ฌ ๋ชจ๋ธ์„ ๋“ฑ๋กํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ณณ์—์„œ๋Š” ๋ชจ๋ธ์„ ์„œ๋น™ํ•˜๊ณ  ์ถ”๋ก  ๋ฐ ์˜ˆ์ธก์„ ์œ„ํ•ด ๋ชจ๋ธ์„ ๋ฐฐํฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Register, serve, and deploy models from AutoML

๊ธฐ์ˆ  ๊ฐ€์ด๋“œ eBook

MLOps์˜ Big Book

Databricks AutoML ์ฒดํ—˜ํ•˜๊ธฐ

Databricks AutoML์€ Databricks ๋จธ์‹  ๋Ÿฌ๋‹ ๊ฒฝํ—˜์˜ ์ผ๋ถ€๋กœ ๊ณต๊ฐœ ๋ฏธ๋ฆฌ๋ณด๊ธฐ๊ฐ€ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. ์‹œ์ž‘ํ•˜๊ธฐ ์œ„ํ•ด์„  ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ง„ํ–‰ํ•˜์„ธ์š”:

๋ฐ์ดํ„ฐ๋ธŒ๋ฆญ์Šค UI์—์„œ ์™ผ์ชฝ ์‚ฌ์ด๋“œ๋ฐ”๋ฅผ ํ†ตํ•ด '๋จธ์‹  ๋Ÿฌ๋‹' ํ™˜๊ฒฝ์œผ๋กœ ์ „ํ™˜ํ•˜์„ธ์š”. "(+) ๋งŒ๋“ค๊ธฐ"๋ฅผ ํด๋ฆญํ•˜๊ณ  "AutoML ์‹คํ—˜"์„ ์„ ํƒํ•˜๊ฑฐ๋‚˜, ์‹คํ—˜ ํŽ˜์ด์ง€๋กœ ์ด๋™ํ•˜์—ฌ "AutoML ์‹คํ—˜ ๋งŒ๋“ค๊ธฐ"๋ฅผ ํด๋ฆญํ•˜์„ธ์š”. ์„ค๋ช…์„œ์—์„œ๋Š” AutoML API์˜ ๋‹จ์ผ ํ˜ธ์ถœ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Databricks AutoML์„ ์ง์ ‘ ์‚ฌ์šฉํ•ด ๋ณด์‹œ๋ ค๋ฉด, Databricks AutoML์— ๋Œ€ํ•œ ์ž์„ธํ•œ ์ •๋ณด๋ฅผ ํ™•์ธํ•˜๊ณ  AWS, Azure, GCP์—์„œ ์–ด๋–ป๊ฒŒ ์‚ฌ์šฉํ•˜๋Š”์ง€ ์•Œ์•„๋ณด๊ฑฐ๋‚˜, Databricks Academy์˜ AutoML ์˜ˆ์ธก ๊ณผ์ •์„ ์ˆ˜๊ฐ•ํ•ด ๋ณด์„ธ์š”(๋‹จ, Databricks Academy ๋กœ๊ทธ์ธ์ด ํ•„์š”ํ•œ Databricks ๊ณ ๊ฐ๋งŒ ์ˆ˜๊ฐ• ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค).

AutoML์„ ์ฒ˜์Œ ์‚ฌ์šฉํ•˜์‹œ๋Š” ๋ถ„๋“ค์€ ํƒœํ‰์–‘ ํ‘œ์ค€์‹œ๋กœ 2์›” 10์ผ ์˜ค์ „ 10์‹œ์— Fabletics์—์„œ ๊ฐœ์ตœํ•˜๋Š” ๋ผ์ด๋ธŒ ๋ฐ๋ชจ์— ์ฐธ๊ฐ€ํ•ด ๋ณด์„ธ์š”. AutoML์˜ ๊ธฐ๋ณธ ์‚ฌํ•ญ์„ ๋‹ค๋ฃจ๋ฉฐ, ์–ด๋–ค ์—ญํ• ์ด๋“  AutoML์„ ํ™œ์šฉํ•˜์—ฌ ML ํ”„๋กœ์ ํŠธ๋ฅผ ๋น ๋ฅด๊ฒŒ ์‹œ์ž‘ํ•˜๊ณ  ๋‹จ์ˆœํ™”ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์•ˆ๋‚ดํ•ด ๋“œ๋ฆด ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ธฐ๋Œ€ํ•˜์…”๋„ ์ข‹์Šต๋‹ˆ๋‹ค!

๊ฒŒ์‹œ๋ฌผ์„ ๋†“์น˜์ง€ ๋งˆ์„ธ์š”

๊ด€์‹ฌ ์žˆ๋Š” ์นดํ…Œ๊ณ ๋ฆฌ๋ฅผ ๊ตฌ๋…ํ•˜๊ณ  ์ตœ์‹  ๊ฒŒ์‹œ๋ฌผ์„ ๋ฐ›์€ํŽธ์ง€ํ•จ์œผ๋กœ ๋ฐ›์•„๋ณด์„ธ์š”