문제 › 4

4. 웹 스크래퍼

Easy 바이브코딩
문제 설명
[문제] 미리 정의된 mock 웹페이지를 조회하고, HTML에서 정보를 추출하는 MCP 서버입니다. 실제 네트워크 호출은 하지 않고, 서버에 내장된 URL→HTML 사전만 사용합니다. 내장 mock 데이터 (아래 2개 URL만 존재): "https://example.com" -> "<html><body><h1>Example Domain</h1><a href='/about'>About</a><a href='/contact'>Contact</a></body></html>" "https://test.com" -> "<html><body><h1>Test Site</h1><h2>Welcome</h2></body></html>" [구현할 함수] - fetch_url(url) -> str url이 내장 사전에 있으면 해당 HTML 문자열을, 없으면 빈 문자열("")을 반환합니다. - extract_links(html) -> array<string> HTML 안의 모든 <a> 태그에서 href 값을 나타난 순서대로 추출합니다. - extract_text(html, tag) -> array<string> 지정한 태그 <tag>...</tag> 의 안쪽 텍스트만 추출합니다 (내부 태그는 제거). [힌트] 정규식으로 태그를 파싱하세요. (Python: re / C++: <regex> / Java: java.util.regex) [예시] fetch_url("https://example.com") -> "<html> ... About ... </html>" fetch_url("https://없음.com") -> "" extract_links("<a href='/a'>x</a><a href='/b'>y</a>") -> ["/a", "/b"] extract_text("<h1>Hi</h1>", "h1") -> ["Hi"]
로그인하고 풀기 AI가 자동 채점하고 즉시 정답·해설을 알려줘요. 무료.