token2 [TIL] ๋ด์ผ๋ฐฐ์์บ ํ AI 9๊ธฐ - 23ํ ๐ถ ํ์ต ๋ฒ์์คํ ๋ค๋๋ฐ ๊ฐ์ธ ๊ณต๋ถ ๐ถ ํ์ต ๋ด์ฉโจ ๊ฐ์ธ ๊ณต๋ถโ๏ธ ์์น ์ธ์ฝ๋ฉ 1. ์์น ์ธ์ฝ๋ฉ 1) ๋ด์ฉ - ํธ๋์คํฌ๋จธ์์๋ ๋ชจ๋ ์ ๋ ฅ์ ๋์์ ์ฒ๋ฆฌ - ๊ทธ ๊ณผ์ ์์ ์์ ์ ๋ณด๊ฐ ์ฌ๋ผ์ง - ์ด๋ ์์๋ฅผ ์ถ๊ฐํด์ฃผ๋ ์ญํ ์ ๋ด๋น 2. ์ ๋์ ์์น ์ธ์ฝ๋ฉ(absolute position encoding) 1) ๋ด์ฉ - ์ ๋ ฅ ํ ํฐ์ ์์น์ ๋ฐ๋ผ ๊ณ ์ ๋ ์๋ฒ ๋ฉ์ ๋ํจ - ํ ํฐ๊ณผ ํ ํฐ ์ฌ์ด์ ์๋์ ์ธ ์์น์ ๋ณด ํ์ฉํ์ง ๋ชปํจ - ๊ธด ํ ์คํธ๋ฅผ ์ถ๋ก ํ๋ ๊ฒฝ์ฐ์๋ ์ฑ๋ฅ์ด ๋จ์ด์งโ๏ธ ํ ํฐํ ์ํ ์ฝ๋# ํ ์คํธ๋ฅผ ์ ์ ํ ๋จ์๋ก ๋๋ (๋์ด์ฐ๊ธฐ ๊ธฐ์ค)input_text = "๋๋ ์ต๊ทผ ํ๋ฆฌ ์ฌํ์ ๋ค๋ ์๋ค"input_text_list = input_text.split().. 2025. 2. 6. [TIL] ๋ด์ผ๋ฐฐ์์บ ํ AI 9๊ธฐ - 21ํ ๐ถ ํ์ต ๋ฒ์์คํ ๋ค๋๋ฐ ๊ฐ์ธ ๊ณต๋ถ ๐ถ ํ์ต ๋ด์ฉโจ ๊ฐ์ธ ๊ณต๋ถโ๏ธ ํ ํฐํ 1. ํ ํฐ (token) 1) ๊ฐ๋ : ์ฃผ์ด์ง ํ ์คํธ๋ฅผ ๋ถ์ ๋ฐ ์ฒ๋ฆฌ ๊ฐ๋ฅํ ์์ ๋จ์๋ก ๋๋ ๊ฒ 2. ํ ํฐํ 1) ๊ฐ๋ : ํ ์คํธ๋ฅผ ์ ์ ํ ๋จ์๋ก ๋๋๊ณ ์ซ์ ์์ด๋๋ฅผ ๋ถ์ฌํ๋ ๊ฒ 2) ๋ด์ฉ - ํ๊ธ์ ์๊ฒ (์์๊ณผ๋ชจ์) ๋จ์๋ถํฐ ํฌ๊ฒ ๋จ์ด ๋จ์๋ก ๋๋์ ์๋ค - ์ด๋ค ํ ํฐ์ด ์ด๋ค ์ซ์ ์์ด๋๋ก ์ฐ๊ฒฐ๋๋์ง ๊ธฐ๋ก๋ ์ฌ์ ์ ๋ง๋ค์ด์ผ ํ๋ค > ๋จ์๊ฐ ํฐ ๊ฒฝ์ฐ: ์๋ฏธ ์ ์ง๋ ์ ๋์ง๋ง ์ฌ์ ์ด ์ปค์ง๋ค. > ๋จ์๊ฐ ์์ ๊ฒฝ์ฐ: ์ฌ์ ์ ์์์ง์ง๋ง, ๋จ์ด์ ์๋ฏธ๊ฐ ์ฌ๋ผ์ง๋ค. 2. ์๋ธ์๋ ํ ํฐํ 1) ๊ฐ๋ : ๋ฐ์ดํฐ์ ๋ฑ์ฅํ๋ ๋น๋์ ๋ฐ๋ผ ํ ๊ทผํ ๋จ์๋ฅผ ๊ฒฐ์ 2) ๋ด์ฉ - ๊ธฐ์กด ํ .. 2025. 2. 4. ์ด์ 1 ๋ค์