๊ธฐํ(๊ฐ๋ฐ)
[python] ์ธ์คํ๊ทธ๋จ ํฌ๋กค๋ง ํ๊ธฐ(instagram Crawling)
๋จผ์ ์๋ฐ์คํฌ๋ฆฝํธ๊ฐ ์๋๋ ํฌ๋กค๋ง ํ๋๋ฒ https://10000sukk.tistory.com/3 [python]๋ฌด์ ์ฌ ํฌ๋กค๋ง ํ๊ธฐ Crawling ๋จผ์ url์ ๋ฐ๋๋ค baseUrl = 'https://store.musinsa.com/app/product/search?search_type=1&q=' baseUrl1 = '&page=' plusUrl = input('๊ฒ์ํ ์ท์ ์ ๋ ฅํ์์ค: ') pageNum =1 url = baseUrl + quote_plus(plus.. 10000sukk.tistory.com ์ธ์คํ๋ ์๋ฐ์คํฌ๋ฆฝํธ ํ์ด์ง, ์ฆ, ๊ทธ์๋ง๋ ๋ฐฉ์์ผ๋ก ํฌ๋กค๋ง ์๊ตฌ๋ฉ๋๋ค. ์ ๋ ๋ฏธํกํ์ง๋ง ํ์ด์ง๋ฅผ ํฌ๋กค๋ง ํ๊ธฐ์ํด ์๋ก ๋ถ๋ฌ์ค๊ณ ํฌ๋กค๋ง ํ๊ณ -> ์๋ก ๋ถ๋ฌ์ค๊ณ ํฌ๋กค๋งํ๊ณ -> ์๋ก ๋ถ๋ฌ......
[python]๋ฌด์ ์ฌ ํฌ๋กค๋ง ํ๊ธฐ Crawling
๋จผ์ url์ ๋ฐ๋๋ค baseUrl = 'https://store.musinsa.com/app/product/search?search_type=1&q=' baseUrl1 = '&page=' plusUrl = input('๊ฒ์ํ ์ท์ ์ ๋ ฅํ์์ค: ') pageNum =1 url = baseUrl + quote_plus(plusUrl) + baseUrl1 + str(pageNum) quote_plus๋ ํน์๋ฌธ์๋ ๋ค๋ฅธ ํ์์ ๋ฌธ์๋ฅผ ์์คํค ์ฝ๋๋ก ๋ณํํด์ฃผ๊ณ ๊ณต๋ฐฑ์ '+'๋ก ๋ณํํ๋ค. ์ฐธ๊ณ ๋ก, quote()๋ ๊ณต๋ฐฑ์ '%20'์ผ๋ก ๋ณํํ๋ค. ์ด๋ฅผ ์ด์ from selenium import webdriver ์ ์ด์ฉํด์ webdriver.Chrome()์ผ๋ก ์ด์๊ฐ ์๋๊ฒ์ด๋ค. ์ด๊ฒ ๋ฌด์จ ๋ง์ด๋๋ฉด selenium..
python ํ๊ฒฝ๋ณ์ ์ค์
์ผ๋จ ์์ ์ด๋ฏธ์ง ์ฒ๋ผ ํ์ด์ฌ(python3.7)์ ๊น์์ง๋ง cmd์ python...pip....python3 ์ณ๋ ์๋ฉ๋๋ค. ํ์ด์ฌ์ด ์ ์ฅ๋ ํด๋๋ก ์ด๋ํ๊ฑฐ๋ ์๋๋ฉด ํ๊ฒฝ๋ณ์๋ฅผ ์ค์ ํด์ค์ผํฉ๋๋ค. ์๋ ํ๊ฒฝ๋ณ์๊ฐ ๋ญ๊ธธ๋??? ๊ฐ๋จํ ๋งํด๋ณผ๊ป์. ํ์ผ์ ์คํ ํ ๋ ค๋ฉด ํด๋น ํด๋๊น์ง ๊ฐ์ผํ๋๋ฐ ํ์ด์ฌ ๊ฐ์ ํ๋ก๊ทธ๋จ๋ค์ ์ธ๋๋ง๋ค ๊ฐ๋ค๊ฐ ํ ์ ์์ด์... ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ธ๋๋ง๋ค ํด๋์ด๋ํ์ง ์์ผ๋.... ๊ทธ๋ฌ๋ ํ๊ฒฝ๋ณ์๋ก ์ปดํจํฐ์๊ฒ ์ด๋ ๊ฒ ์ด๋ ์ํ๊ณ ๋ ์ด ํ์ผ๋ค์ด ์๋ ํด๋๋ค์ ๊ฒฝ๋ก๋ฅผ ๋ฏธ๋ฆฌ ์ค์ ํด๋๋ฉด ๋๋ ๊ฑฐ์ฃ ..! ์ ๋ณด๋ค ์ ์ค๋ช ํด์ค ์ฌ๋๊บผ ๊ฐ์ ๋ณด์ธ์ ์ด๊ฑฐ click! C:\Users\๋ด์ด๋ฆ..ใ \AppData\Local\Programs\Python\Python37-32 C:\Users\๋ด์ด๋ฆ..ใ \AppD..