Merge branch 'main' of https://github.com/unclecode/crawl4ai

2024-11-05 13:02:59 +00:00
parent 1222e456fb b51263664e
commit 11721eb0ce
1 changed files with 35 additions and 1 deletions
--- a/main.py
+++ b/main.py
@@ -1,6 +1,16 @@
-import asyncio
+import asyncio, os
 from fastapi import FastAPI, HTTPException, BackgroundTasks, Request
 from fastapi.responses import JSONResponse
 from fastapi import FastAPI, HTTPException, Request
 from fastapi.responses import HTMLResponse, JSONResponse
 from fastapi.staticfiles import StaticFiles
 from fastapi.middleware.cors import CORSMiddleware  
 from fastapi.templating import Jinja2Templates
 from fastapi.exceptions import RequestValidationError
 from starlette.middleware.base import BaseHTTPMiddleware
 from starlette.responses import FileResponse
 from fastapi.responses import RedirectResponse
 from pydantic import BaseModel, HttpUrl, Field
 from typing import Optional, List, Dict, Any, Union
 import psutil
@@ -20,6 +30,8 @@ from crawl4ai.extraction_strategy import (
    JsonCssExtractionStrategy,
 )
 __location__ = os.path.realpath(os.path.join(os.getcwd(), os.path.dirname(__file__)))
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
@@ -295,6 +307,23 @@ class CrawlerService:
                await asyncio.sleep(1)
 app = FastAPI(title="Crawl4AI API")
 # CORS configuration
 origins = ["*"]  # Allow all origins
 app.add_middleware(
    CORSMiddleware,
    allow_origins=origins,  # List of origins that are allowed to make requests
    allow_credentials=True,
    allow_methods=["*"],  # Allows all methods
    allow_headers=["*"],  # Allows all headers
 )
 # Mount the pages directory as a static directory
 app.mount("/pages", StaticFiles(directory=__location__ + "/pages"), name="pages")
 app.mount("/mkdocs", StaticFiles(directory="site", html=True), name="mkdocs")
 site_templates = Jinja2Templates(directory=__location__ + "/site")
 templates = Jinja2Templates(directory=__location__ + "/pages")
 crawler_service = CrawlerService()
@app.on_event("startup")
@@ -305,6 +334,11 @@ async def startup_event():
 async def shutdown_event():
    await crawler_service.stop()
@app.get("/")
 def read_root():
    return RedirectResponse(url="/mkdocs")
@app.post("/crawl")
 async def crawl(request: CrawlRequest) -> Dict[str, str]:
    task_id = await crawler_service.submit_task(request)