๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

numpy4

[TIL] ๋‚ด์ผ๋ฐฐ์›€์บ ํ”„ AI 9๊ธฐ - 13ํšŒ ๐Ÿถ ํ•™์Šต ๋ฒ”์œ„๋จธ์‹ ๋Ÿฌ๋‹ ๊ฐœ์ธ๊ณต๋ถ€๋จธ์‹ ๋Ÿฌ๋‹ ํŠน๊ฐ• ๐Ÿถ ๊ณต๋ถ€ ๋‚ด์šฉโœจ ๋จธ์‹ ๋Ÿฌ๋‹๐Ÿšฉ ๊ฐœ๋…  > ์Šค์ผ€์ผ(Scale)์ด ๋‹ค๋ฅด๋‹ค?    - ํŠน์„ฑ ๊ฐ„์˜ ๊ฐ’์˜ ๋ฒ”์œ„๊ฐ€ ๋‹ค๋ฅธ ๊ฒฝ์šฐ ex) ๊ธธ์ด๋Š” 10~40, ๋†’์ด๋Š” 100~1000   - ์ด๋Ÿฐ ๊ฒฝ์šฐ, ๊ทผ์ ‘ ๋ฐ์ดํ„ฐ ํŒŒ์•… ๋“ฑ์—์„œ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Œ   - ์ •๊ทœํ™” (๋ฒ”์œ„ ๊ฐ’์„ ๋™์ผํ•˜๊ฒŒ ๋งž์ถฐ์ฃผ๋Š” ์ž‘์—…)์ด ํ•„์š”ํ•จ  > ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ๊ธฐ์ค€์ด ๋‹ค๋ฅด๋ฉด ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์˜ˆ์ธกํ•  ์ˆ˜ ์—†์Œ   - ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ˜์ธ ๊ฒฝ์šฐ ํŠนํžˆ ๊ทธ๋ ‡๋‹ค   - ์—ฌ๊ธฐ์—๋Š” k-์ตœ๊ทผ์ ‘ ์ด์›ƒ ๋ชจ๋ธ๋„ ํฌํ•จ   - ์ œ๋Œ€๋กœ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ํŠน์„ฑ๊ฐ’์„ ์ผ์ •ํ•œ ๊ธฐ์ค€์œผ๋กœ ๋งž์ถฐ ์ฃผ์–ด์•ผ ํ•จ   - ์ด๋Ÿฐ ์ž‘์—…์„ ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ(data preprocessing)๋ผ๊ณ  ํ•จ ๐Ÿšฉ ์šฉ์–ด  โœจ ๋ถ„์‚ฐ(Variance)   - ๋ฐ์ดํ„ฐ๊ฐ€ ํ‰๊ท ์œผ๋กœ๋ถ€ํ„ฐ .. 2024. 12. 16.
(Python) NumPy ๋ฐฐ์—ด ์ƒ์„ฑ ๐Ÿถ NumPy ๋ฐฐ์—ด ์ƒ์„ฑ๐Ÿšฉ numpy.ndarray - NumPy์˜ ํ•ต์‹ฌ ๊ธฐ๋Šฅ ์ค‘ ํ•˜๋‚˜๋กœ, ๋‹ค์ฐจ์› ๋ฐฐ์—ด์„ ํ‘œํ˜„ํ•˜๋Š” ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ โœ”๏ธ ์ฃผ์š”ํŠน์ง• 1) ๊ณ ์ •๋œ ํฌ๊ธฐ: ์ƒ์„ฑ ์‹œ ์ง€์ •๋œ ํฌ๊ธฐ ๋ณ€๊ฒฝ ๋ถˆ๊ฐ€, ๋ฐฐ์—ด์˜ ํฌ๊ธฐ๋ฅผ ๋ณ€๊ฒฝ ์‹œ ์ƒˆ๋กœ์šด ๋ฐฐ์—ด ์ƒ์„ฑ 2) ๋™์ผํ•œ ๋ฐ์ดํ„ฐ ํƒ€์ž…: ๋ฐฐ์—ด ๋‚ด์˜ ๋ชจ๋“  ์š”์†Œ๋Š” ๊ฐ™์€ ๋ฐ์ดํ„ฐ ํƒ€์ž…์„ ๊ฐ€์ง 3) ํšจ์œจ์„ฑ๊ณผ ์„ฑ๋Šฅ: ๋‚ด๋ถ€์ ์œผ๋กœ ์ตœ์ ํ™”๋œ C์™€ Fortran ์ฝ”๋“œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋น ๋ฅธ ๋ฐฐ์—ด ์—ฐ์‚ฐ์„ ์ง€์› โœ”๏ธ ์†์„ฑ (Attribute) 1) ndarray.ndim: ๋ฐฐ์—ด์˜ ์ฐจ์› ์ˆ˜ 2) ndarray.shape: ๋ฐฐ์—ด์˜ ํ˜•ํƒœ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ํŠœํ”Œ, ๊ฐ ์ฐจ์›์˜ ํฌ๊ธฐ๋ฅผ ๋‚˜ํƒ€๋ƒ„ 3) ndarray.size: ๋ฐฐ์—ด์˜ ์ „์ฒด ์š”์†Œ ์ˆ˜ 4) ndarray.dtype: ๋ฐฐ์—ด์˜ ๋ฐ์ดํ„ฐ ํƒ€์ž… 5) nda.. 2024. 12. 3.
[TIL] ๋‚ด์ผ๋ฐฐ์›€์บ ํ”„ AI 9๊ธฐ - 5ํšŒ ๐Ÿถ ํ•™์Šต ๋ฒ”์œ„๊ฐ•์ขŒ: ์ธ๊ณต์ง€๋Šฅ์„ ์œ„ํ•œ ํŒŒ์ด์ฌ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (1์ฃผ์ฐจ ~ 2์ฃผ์ฐจ)Pandas, ์‹œ๋ฆฌ์ฆˆ, ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ๐Ÿถ ๊ณต๋ถ€๋‚ด์šฉโœจ ์‹œ๋ฆฌ์ฆˆ(Series)๐Ÿšฉ ๋‚ด์šฉ1. ์‹œ๋ฆฌ์ฆˆ(Series) - ๋‹จ์ผ ์—ด์„ ๋‚˜ํƒ€๋‚ด๋Š” 1์ฐจ์› ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๋กœ, ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์˜ ๊ตฌ์„ฑ ์š”์†Œ ์ค‘ ํ•˜๋‚˜ - Pandas๋ฅผ ์ด์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ์˜ ํ•„ํ„ฐ๋ง, ์ •๋ ฌ, ์ง‘๊ณ„ ๋“ฑ ๋‹ค์–‘ํ•œ ์ž‘์—… ์ˆ˜ํ–‰ โœ”๏ธ ์ฃผ์š”ํŠน์ง• 1) ์œ ์—ฐํ•œ ์ธ๋ฑ์Šค ์„ค์ •: ๋ฐ์ดํ„ฐ์— ์ ‘๊ทผํ•˜๊ธฐ ์œ„ํ•ด ์ •์ˆ˜ ๊ธฐ๋ฐ˜ ์ธ๋ฑ์Šค ๋˜๋Š” ๋ ˆ์ด๋ธ” ๊ธฐ๋ฐ˜ ์ธ๋ฑ์Šค๋ฅผ ์‚ฌ์šฉ 2) ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์œ ํ˜• ์ง€์›: ๋ชจ๋“  ๋ฐ์ดํ„ฐ ์œ ํ˜•์€ ํ•˜๋‚˜์˜ Series์— ๋™์ผํ•˜๊ฒŒ ์ ์šฉ๋˜์–ด์•ผ ํ•จ 3) ๋ฒกํ„ฐํ™” ์—ฐ์‚ฐ: NumPy ๋ฐฐ์—ด์„ ๊ธฐ๋ฐ˜ > ๋Œ€๋ถ€๋ถ„์˜ NumPy ์—ฐ์‚ฐ์„ ์‚ฌ์šฉ ๊ฐ€๋Šฅ (์—ฐ์‚ฐ์€ ๋ฒกํ„ฐํ™”๋˜์–ด ์†๋„ ํ–ฅ์ƒ) ๐Ÿšฉ ์‚ฌ์šฉ๋ฒ• # pandas i.. 2024. 11. 29.
[TIL] ๋‚ด์ผ๋ฐฐ์›€์บ ํ”„ AI 9๊ธฐ - 4ํšŒ ๐Ÿถ ํ•™์Šต ๋ฒ”์œ„๊ฐ•์ขŒ: ์ธ๊ณต์ง€๋Šฅ์„ ์œ„ํ•œ ํŒŒ์ด์ฌ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (1์ฃผ์ฐจ ~ 2์ฃผ์ฐจ)Pandas, ์‹œ๋ฆฌ์ฆˆ, ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„NumPy, ๋ฐฐ์—ด ์ƒ์„ฑ, ๊ธฐ์ดˆ ์—ฐ์‚ฐ, ๋ฐฐ์—ด ์—ฐ์‚ฐ, ๋ธŒ๋กœ๋“œ์บ์ŠคํŒ… ๐Ÿถ ๊ณต๋ถ€๋‚ด์šฉโœจ Pandas๐Ÿšฉ ์š”์•ฝ - Pandas, ์„ค์น˜, ์‹œ๋ฆฌ์ฆˆ(Series), ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„(DataFrame) ๐Ÿšฉ ๋‚ด์šฉ1. Pandas - Python์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์‰ฝ๊ฒŒ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋Š” ๋ฐ์ดํ„ฐ ์กฐ์ž‘ ๋ฐ ๋ถ„์„ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ - ํ†ต๊ณ„์  ๋ถ„์„์ด๋‚˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ ์ž‘์—…์— ์œ ์šฉ โœ”๏ธ ์ฃผ์š”๊ธฐ๋Šฅ 1) ๋ฐ์ดํ„ฐ ์ •์ œ ๋ฐ ์ „์ฒ˜๋ฆฌ: ๋ˆ„๋ฝ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ, ๋ฐ์ดํ„ฐ ํ˜•์‹ ๋ณ€ํ™˜, ๋ฐ์ดํ„ฐ์…‹ ๋ณ‘ํ•ฉ ๋ฐ ์—ฐ๊ฒฐ ๋“ฑ 2) ๋ฐ์ดํ„ฐ ํƒ์ƒ‰: ๋ฐ์ดํ„ฐ ๊ทธ๋ฃนํ™”, ํ†ต๊ณ„ ์š”์•ฝ, ๋ฐ์ดํ„ฐ ํ•„ํ„ฐ๋ง ๋“ฑ 3) ๋ฐ์ดํ„ฐ ์ž…์ถœ๋ ฅ: ๋‹ค์–‘ํ•œ ํŒŒ์ผ ํ˜•์‹(CSV, Excel ๋“ฑ)์œผ๋กœ ๋ฐ์ด.. 2024. 11. 28.