로컬에서 구동하는 “딥 리서치” browser use

📌 Browser-Use란?

browser-use의 Web UI는 자동화 및 원격 브라우저 제어를 위한 인터페이스입니다. 이는 다양한 환경에서 웹 스크래핑, UI 자동화, API 호출을 더 쉽게 수행할 수 있도록 돕는 도구입니다.


🔹 1. 주요 기능

✅ 웹 브라우저 원격 제어

  • browser-use는 Puppeteer 및 Playwright 같은 헤드리스 브라우저 엔진을 활용하여 UI 자동화 및 원격 브라우징을 지원합니다.
  • Web UI를 통해 브라우저 세션을 관리하고, 직접 조작하거나, 자동화 스크립트를 실행할 수 있습니다.

✅ 웹 자동화 및 데이터 스크래핑

  • 특정 웹사이트에서 데이터를 자동으로 가져올 수 있도록 설정할 수 있습니다.
  • browser-use Web UI를 통해 XPath 및 CSS Selector를 사용하여 데이터를 추출할 수 있습니다.

✅ 멀티 인스턴스 지원

  • 여러 개의 브라우저 세션을 실행할 수 있으며, 이를 Web UI에서 관리할 수 있습니다.
  • 각 인스턴스는 독립적인 쿠키 및 세션을 가질 수 있어, 여러 계정 로그인 또는 멀티탭 작업이 가능합니다.

✅ 스크립트 실행 기능

  • JavaScript 또는 Python 스크립트를 Web UI에서 실행하여 자동화된 작업을 설정할 수 있습니다.
  • API 호출을 통해 브라우저 제어가 가능하므로, 외부에서 특정 액션을 트리거할 수 있습니다.

✅ 프록시 및 사용자 지정 헤더 지원

  • browser-use는 다양한 프록시 설정을 지원하여 IP 우회가 가능합니다.
  • Web UI에서 User-Agent, Referer, Headers 등을 커스텀 설정하여 크롤링 탐지를 회피할 수 있습니다.

즉, 이걸로 무엇을 할 수 있냐면, 쿠팡에 접속해서 브라운 9시리즈 면도기중에 로켓배송으로 가장 저렴한걸 장바구니에 담아서 결제해! 라는 명령을 내리면, 수행한다는 거죠.
(물론 매번 모든걸 한번에 수행하진 못합니다, 이상한 에러가 날 수 있고, 로그인을 해줘야 할 수도 있고 해서, 조금의 코딩은 필요할 수 있습니다)

그리고 또 한가지, 딥 리서치를 시킬 수 있는 기능이 존재 합니다.

예를 들어 위와 같이 딥리서치를 해 보면

아래와 같은 로그를 볼 수 있습니다.

Extracted page content:
Title: – YouTube URL Source: https://www.youtube.com/watch?v=mudcagzsb9A
Markdown Content: – YouTube =============== Search Watch later Share Copy link
Info Shopping Tap to unmute 2x Image
3 If playback doesn’t begin
shortly, try restarting your device. Image
4 • Share Include playlist An
error occurred while retrieving sharing information. Please try again later.
Image 5 0:00 0:00 / 0:00•Live

  • • Scroll for details • NaN / NaN Back
    Search

INFO [src.agent.custom_agent] ✅ Task completed successfully
INFO [src.agent.custom_agent] Created GIF at agent_history.gif
INFO [controller] 🔗 Opened new tab with https://www.mdpi.com
INFO [controller] 🔄 Switched to tab 0
INFO [src.utils.deep_research] Extracted page content:
Title: https://www.google.com/search?q=LWIR%20vs%20ESWIR&udm=14 URL Source:
https://www.google.com/search?q=LWIR%20vs%20ESWIR&udm=14 Markdown Content:
https://www.google.com/search?q=LWIR%20vs%20ESWIR&udm=14 =============== * * *

  • * * About this page Our systems have detected unusual traffic from your
    computer network. This page checks to see if it’s really you sending the
    requests, and not a robot. Why did this happen? This page
    appears when Google automatically detects requests coming from your computer
    network which appear to be in violation of the Terms of Service. The block will expire
    shortly after those requests stop. In the meantime, solving the above CAPTCHA
    will let you continue to use our services. This traffic may have been sent by
    malicious software, a browser plug-in, or a script that sends automated
    requests. If you share your network connection, ask your administrator for
    help — a different computer using the same IP address may be responsible.
    Learn more Sometimes you
    may be asked to solve the CAPTCHA if you are using advanced terms that robots
    are known to use, or sending requests very quickly. IP address:
    2600:1900:0:2d04::2100 Time: 2025-02-25T08:24:04Z URL:
    https://www.google.com/search?q=LWIR%20vs%20ESWIR&udm=14

INFO [src.agent.custom_agent] ❌ Failed to complete task in maximum steps
INFO [src.agent.custom_agent] Created GIF at agent_history.gif
INFO [src.utils.deep_research] save query: MWIR camera specifications and uses at ./tmp/deep_research/ad7a689d-1305-4b5a-93b1-7c6b0d4cbac9\query_results\1-1.md
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out how to process the user’s query about SWIR, MWIR, LWIR, and ESWIR cameras. The user wants a detailed comparison between these types of cameras. Let me start by understanding each acronym.

First, SWIR stands for Short-Wave Infrared. These cameras operate in the 0.9 to 1.7 micrometer range. They’re often used in applications where some NIR wavelengths are blocked, like in glass or certain materials. I remember reading that SWIR is good for things like thermal imaging and can sometimes see through fog.

Next up is MWIR, which stands for Mid-Wave Infrared. This operates from 1.7 to 5 micrometers. MWIR cameras are typically used in military and surveillance because they work well in both day and night conditions. They can detect a wide range of thermal emissions, making them versatile.

Then there’s LWIR, or Long-Wave Infrared, covering 5 to 8 micrometers. These are often used for high-temperature objects like industrial furnaces or metal processing. They have better resolution at longer distances but might not be as effective in detecting cooler objects.

ESWIR is Extended Short-Wave Infrared, operating from 0.9 to 1.7 micrometers, similar to SWIR but maybe optimized differently. I’m a bit fuzzy on the exact differences here; perhaps ESWIR offers better sensitivity or specific spectral bands?

Looking at the current search results provided, it’s mostly about the FLIR A6780 MWIR camera. The specs mention 1.0 to 5.0 micrometers, which fits the MWIR range. It uses InSb detectors and has features like motorized focus and Gigabit Ethernet connectivity. This suggests that MWIR cameras are designed for high thermal sensitivity and flexibility in various applications.

I should structure the response by defining each camera type, their spectral ranges, key features, typical use cases, advantages, and limitations. Including technical specs like detector types (like InSb for MWIR) adds depth. I also need to ensure that each section is concise but informative, avoiding redundancy since the user emphasized minimizing information loss.

I should make sure to highlight how each camera type differs in terms of resolution, temperature range, and application suitability. For example, SWIR might be better for certain industrial inspections where LWIR isn’t as effective due to shorter wavelengths capturing different thermal signatures.

Finally, I’ll organize all this into a JSON list with summaries and reasoning on how each piece fits into the overall report. This way, the user gets a clear comparison that can be easily referenced or used in further analysis.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out the differences between SWIR, MWIR, LWIR, and ESWIR cameras. The user provided some previous information which includes details on each type except for MWIR, which they just searched about. Let me start by recalling what I know.

From the Previous Recorded Information, I remember that SWIR (Short-Wave Infrared) operates in 0.9 to 1.7 µm and is good for detecting thermal emissions through glass. It’s used in industrial inspections and surveillance. LWIR (Long-Wave Infrared) covers 5 to 8 µm, ideal for high-temperature applications like furnaces but struggles with cooler objects. ESWIR extends SWIR into NIR, making it better for advanced surveillance.

Now, the current search was about MWIR cameras. The previous info had a FLIR A6780 MWIR camera which operates from 1.0 to 5.0 µm. It uses a cooled InSb detector and has high frame rates. This suggests MWIR is used in industrial and military settings, good for detailed thermal analysis.

I need to structure the JSON output with each camera type as separate entries. Each should have their spectral range, key features, applications, advantages, and disadvantages. The thinking field should explain where this info fits in a report—like introduction or analysis sections.

Wait, I should make sure not to repeat information already present. For example, SWIR’s ability to penetrate glass was mentioned before, so I don’t need to include that again for MWIR unless it adds new context.

I also need to ensure each entry has the correct URL and title if available. Since the current search result didn’t yield useful info beyond the YouTube video (which seems unhelpful), most entries will have “unknown” as source.

Let me outline each camera type:

  1. SWIR: 0.9-1.7 µm, glass penetration, industrial/surveillance.
  2. MWIR: 1.0-5.0 µm, cooled detectors, high frame rates, industrial/military.
  3. LWIR: 5-8 µm, high temp apps, poor for cool objects.
  4. ESWIR: Extends SWIR to NIR, advanced surveillance.

Each should have a summary with key points and thinking on placement in the report.

I think I’ve covered all necessary details without redundancy. Now, structuring each as JSON entries with appropriate titles and URLs where possible.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
INFO [src.utils.deep_research] save query: LWIR camera technology and applications at ./tmp/deep_research/ad7a689d-1305-4b5a-93b1-7c6b0d4cbac9\query_results\1-2.md
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out the differences between SWIR, MWIR, LWIR, and ESWIR cameras. The user provided some previous information and a new search result about LWIR cameras. Let me start by recalling what I know from the previous data.

From before, I remember that SWIR (Short-Wave Infrared) operates in 0.9 to 1.7 µm. They can detect thermal emissions through glass and are used in industrial inspections and surveillance. MWIR (Mid-Wave Infrared) is from 1.0 to 5.0 µm, uses cooled detectors like InSb, and is good for high frame rates. It’s used in military and manufacturing. LWIR (Long-Wave Infrared) covers 5 to 8 µm, ideal for high-temperature objects and longer distances but struggles with cooler ones. ESWIR extends SWIR into NIR, up to 2.6 µm, making them better for advanced surveillance.

Now, looking at the new search result about LWIR cameras from IDTechEx. It mentions that LWIR is used in automotive for ADAS and autonomous driving because they can detect pedestrians and objects in low-light conditions. They’re passive systems using microbolometers, which are reliable but expensive. The report also talks about their future growth due to regulations like NHTSA’s requirements.

I need to extract the key points from this new result without duplicating previous info. The summary should include spectral range, technology used (microbolometers), applications in automotive for safety, and market trends regarding cost and adoption.

Thinking about how this fits into a report: it would go under the analysis section, comparing LWIR with other types. It highlights their niche but growing role in ADAS and autonomous vehicles, which ties into real-world applications and technological advancements.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out the differences between SWIR, MWIR, LWIR, and ESWIR cameras. The user provided some previous information and a new search result about LWIR cameras. Let me start by recalling what I know from the previous data.

From before, I remember that SWIR (Short-Wave Infrared) operates in 0.9 to 1.7 µm. They can detect thermal emissions through glass, which is useful for surveillance and industrial inspections. ESWIR extends this range into NIR, making them better for detecting a wider range of thermal emissions.

MWIR (Mid-Wave Infrared) covers 1.0 to 5.0 µm. The FLIR A6780 example had a cooled InSb detector and high frame rates, used in industrial and military settings. LWIR (Long-Wave Infrared) operates from 5 to 8 µm, ideal for high-temperature objects like furnaces. They have better resolution at longer distances but struggle with cooler objects.

Now, looking at the new search result about LWIR cameras: it’s part of a report by IDTechEx discussing their use in automotive applications. LWIR is used for detecting pedestrians and other road users in low-light conditions because they can pick up heat signatures effectively. The market is growing due to regulations like NHTSA’s mandates for advanced AEB systems.

I need to extract the key points from this new information without duplicating what’s already known. The previous data didn’t cover automotive applications, so that’s a new angle. Also, the report mentions how LWIR will be crucial for autonomous vehicles and robotaxis because of their reliability in low-visibility conditions.

So, I should summarize the new info about LWIR’s role in ADAS, autonomous driving, and regulatory compliance. This adds context to their application beyond industrial uses. It also touches on market growth projections, which is valuable for understanding their future significance.

I need to make sure the summary includes technical specs like spectral range, applications (especially automotive), and how they compare to other camera types in terms of use cases and effectiveness. The thinking part should link this info to sections like analysis or application-specific uses in a report.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out the differences between SWIR, MWIR, LWIR, and ESWIR cameras. The user provided some previous information and a new search result about LWIR cameras. Let me start by recalling what I know from the previous data.

From before, I remember that SWIR (Short-Wave Infrared) operates in 0.9 to 1.7 µm. They can see through glass, which is useful for industrial inspections and surveillance. MWIR (Mid-Wave Infrared) covers 1.0 to 5.0 µm, used in military and manufacturing with cooled detectors. LWIR (Long-Wave Infrared) works from 5 to 8 µm, ideal for high-temperature objects and automotive applications like ADAS. ESWIR extends SWIR into NIR, up to 2.6 µm, for advanced surveillance.

Now, looking at the new search result about LWIR technology and applications. It’s a detailed report from IDTechEx. The content mentions that LWIR cameras operate in 5 to 8 µm, suitable for detecting high-temperature objects and performing well in low-light conditions. They’re increasingly used in automotive for ADAS and autonomous driving because they can detect pedestrians effectively.

The report also talks about market growth driven by regulations like NHTSA’s mandates for advanced AEB. It expects significant adoption in higher SAE level vehicles. Technologically, LWIR uses microbolometers and has potential for sensor fusion with other systems like LiDAR and radar. However, it’s currently limited to high-end vehicles but is expected to become more mainstream as costs come down.

So, how does this new info fit into what I already have? Previously, I noted that LWIR was used in industrial furnaces and had limitations with cooler objects. Now, the IDTechEx report adds automotive applications, regulatory influences, and technological advancements like sensor fusion. This provides a more comprehensive understanding of LWIR’s role beyond just industrial uses.

I should make sure not to repeat information already captured. The new data emphasizes automotive applications, which wasn’t as detailed before. It also introduces market forecasts and regulatory impacts, which are important for a thorough comparison.

In terms of structure, the summary should highlight the spectral range, key features (like microbolometers), applications (especially in ADAS and autonomous driving), and mention the influence of regulations. The thinking part should note that this info is crucial for understanding automotive uses and how LWIR compares to other camera types in safety technologies.

I need to ensure that the summary includes key data points like spectral range, detector type, frame rates if available, and applications. Also, since the source URL and title are provided, I’ll include those accurately.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out the differences between SWIR, MWIR, LWIR, and ESWIR cameras. The user provided some previous information and current search results, so I should use those to create a JSON list with summaries and thinking.

First, looking at the Previous Recorded Information, there are entries about each camera type. For example, SWIR operates in 0.9-1.7 µm, good for detecting through glass. MWIR is from 1.0-5.0 µm, used in industrial and military settings with high frame rates. LWIR covers 5-8 µm, ideal for high-temperature objects and automotive uses like ADAS. ESWIR extends SWIR into NIR, useful for advanced surveillance.

The current search results focus on LWIR technology and applications. It mentions that LWIR cameras are used in automotive for AEB and autonomous driving because they can detect pedestrians well in low-light conditions. They’re passive systems relying on heat signatures, which makes them reliable but limited to higher-end vehicles currently due to cost.

I need to extract the key points from these sources without redundancy. Each entry should have a URL, title, summary, and thinking about where it fits in a report.

For LWIR cameras, the IDTechEx report provides detailed info on their use in ADAS, autonomous driving, and regulatory compliance. It also talks about cost reductions making them more accessible. This is important for understanding their role compared to other camera types.

I should structure each JSON entry with these details, ensuring that key data like spectral ranges and applications are included. The thinking part should explain how each piece can be used in the report—like introduction, background, analysis sections.

So, I’ll create entries for each camera type based on the provided info, making sure to include URLs where available and “unknown” where sources aren’t specified. Each summary will capture essential details without losing important figures.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
INFO [src.utils.deep_research] save query: Difference between SWIR and MWIR cameras at ./tmp/deep_research/ad7a689d-1305-4b5a-93b1-7c6b0d4cbac9\query_results\1-4.md
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out the differences between SWIR, MWIR, LWIR, and ESWIR cameras. The user provided some previous information, but the current search results are just a Google error message about too many requests. Let me start by recalling what I know from the Previous Recorded Information.

From there, I remember that SWIR (Short-Wave Infrared) operates in 0.9 to 1.7 µm and is good for detecting thermal emissions through glass. It’s used in industrial inspections and surveillance. MWIR (Mid-Wave Infrared) covers 1.0 to 5.0 µm, uses cooled detectors like InSb, and is used in industrial, military, and R&D applications with high frame rates.

LWIR (Long-Wave Infrared) works from 5 to 8 µm, ideal for high-temperature objects and automotive ADAS. ESWIR extends SWIR into NIR up to 2.6 µm, enhancing detection capabilities for surveillance and research.

Since the current search didn’t yield new results due to the error, I can only rely on existing data. I should structure the JSON output with each camera type’s specs, applications, pros, cons, and where they fit in a report. Make sure not to repeat information already recorded and include key details like spectral ranges and detector types.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
INFO [src.utils.deep_research] save query: Comparison of LWIR vs ESWIR cameras at ./tmp/deep_research/ad7a689d-1305-4b5a-93b1-7c6b0d4cbac9\query_results\1-5.md
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out the differences between SWIR, MWIR, LWIR, and ESWIR cameras. The user provided a detailed search result from Axiom Optics about these types of infrared cameras. Let me start by understanding each camera type based on the information given.

First, SWIR (Short-Wave Infrared) cameras operate in the range of 0.9 to 1.7 micrometers. They detect reflected light rather than emitted heat. This makes them useful for applications like detecting defects in fruits or electronics, counterfeit detection, and art restoration. The article mentions that Sony’s SenSWIR technology extends this range up to 2.2 micrometers, which is considered ESWIR (Extended SWIR). These cameras use materials like InGaAs, Ge, or InGaAsP for detection.

Next, MWIR (Middle-Wave Infrared) cameras work in the 3 to 5 micrometer range and detect emitted heat. They are effective in industrial settings for gas leak detection and in security for long-range surveillance. The article highlights that MWIR cameras have better penetration through atmospheric conditions compared to LWIR, making them suitable for outdoor use. They often require cooling to reduce noise and use detectors like InSb or HgCdTe.

Then there’s LWIR (Long-Wave Infrared) cameras, which operate from 8 to 14 micrometers. These are typically used in military applications because they can detect heat emitted by people and vehicles. They often use microbolometers and don’t require cooling as frequently as MWIR cameras. However, cooled versions offer higher resolution for specific needs.

ESWIR (Extended SWIR) extends the SWIR range beyond 1.7 micrometers up to around 2.2 micrometers. This allows them to detect a wider range of thermal emissions, useful in advanced surveillance and scientific research where longer wavelengths are necessary.

I should summarize each type’s key features, applications, and technologies used. It’s important to note the differences in their spectral ranges, whether they detect reflected light or emitted heat, and their typical use cases. Also, mentioning the materials and cooling requirements will help differentiate them further.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out the differences between SWIR, MWIR, LWIR, and ESWIR cameras. The user has already provided some previous information, but now they want a comparison specifically between LWIR and ESWIR cameras.

Looking at the current search results, it seems like there was an error because Google returned a 429 Too Many Requests when trying to access the comparison. That means I can’t get direct information from that source. So, I have to rely on the previously recorded information and any other available data.

From the previous records, I know:

  • SWIR (Short-Wave Infrared) operates in the range of 0.9 to 1.7 µm. It’s good for detecting thermal emissions through materials like glass and is used in industrial inspections and surveillance.
  • MWIR (Mid-Wave Infrared) operates from 1.0 to 5.0 µm. The FLIR A6780 MWIR camera, for example, uses a cooled InSb detector and has high frame rates up to 4,130 Hz. It’s used in industrial, military, and manufacturing R&D.
  • LWIR (Long-Wave Infrared) operates from 5 to 8 µm. It’s ideal for high-temperature applications like industrial furnaces and is used in automotive ADAS and autonomous driving because it works well in low-light conditions.
  • ESWIR (Extended Short-Wave Infrared) extends the SWIR range into NIR, up to 2.6 µm. This allows better detection of a wider range of thermal emissions, making it suitable for advanced surveillance and scientific research.

Since I can’t access new information on LWIR vs ESWIR, I’ll have to compare them based on what’s already known.

LWIR operates at longer wavelengths (5-8 µm) and is better for high-temperature objects and low-light conditions. It’s used in automotive applications because it can detect pedestrians effectively.

ESWIR extends SWIR into NIR, offering a broader spectrum (0.9 to 2.6 µm). This makes it more versatile for detecting various thermal emissions, useful in surveillance and scientific research.

So, the key differences would be their spectral ranges, typical use cases, and applications. LWIR is better for high-temperature and automotive needs, while ESWIR offers extended capabilities for broader detection.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
INFO [src.utils.deep_research] 🤯 Start Record Deep Thinking:
INFO [src.utils.deep_research]
Okay, so I need to figure out the differences between SWIR, MWIR, LWIR, and ESWIR cameras. The user provided some previous information, but it seems like the current search didn’t yield any useful results because Google blocked it with a CAPTCHA message. That’s not helpful.

Looking at the Previous Recorded Information, I see that there are summaries about each camera type. For example, SWIR operates in 0.9 to 1.7 µm and is good for detecting thermal emissions through glass. MWIR goes from 1.0 to 5.0 µm and is used in industrial and military settings. LWIR covers 5 to 8 µm and is ideal for high-temperature objects, while ESWIR extends SWIR into the NIR spectrum up to 2.6 µm.

Since the current search didn’t give any new data, I can only rely on what’s already been recorded. So, I should structure the JSON output based on that information without adding anything new from the blocked search results.

I need to make sure each entry is concise but includes key details like spectral ranges and applications. Also, I must avoid redundancy by checking if the same info is already present. For example, there are multiple entries about LWIR in automotive applications, so I should include that once.

The thinking field should explain how each piece of information can be used in a report, maybe in sections like introduction or analysis. Since all the data is from previous searches, the URLs and titles will either be known sources or marked as unknown if not attributed.

I’ll go through each entry in Previous Recorded Information, extract the necessary details, ensure they’re unique, and format them into JSON with appropriate thinking on their placement in a report.

INFO [src.utils.deep_research] 🤯 End Record Deep Thinking
<마치 추론 모델인양..열심히 추론하는 모습 ㄷㄷㄷㄷㄷㄷㄷ>

이런 식으로 결과물을 마크다운으로 생성합니다.

내용물을 보면 마크다운 문법으로 엄청난 양을 리서치를 해 놨네요;;
(참고로 3090 24g모델 한장으로 돌린거라 거진 30분 넘게 돌아간거 같습니다;;;;)
(1번 문서에는 출처가 정리되고 2~3번 문서에는 내용이 정리되어 있네요)

이렇게 딥리서치를 구동할 수 있는 장점이 있어서 퍼플렉시티나 챗gpt의 딥리서치 보다 조금 더 풍부한 리서치를 시킬 수 있는 장점이 있습니다.

이외 다양한 활용법으로는

🎯 1. 데이터 크롤링 (Web Scraping)

✔️ 예제: 뉴스 사이트에서 최신 기사 수집

  • 특정 뉴스 사이트에 접속하여 제목, 링크, 요약 등을 자동으로 가져올 수 있음.
  • CSS Selector 또는 XPath를 활용하여 원하는 요소를 추출 가능.

✅ 사용 예제

javascript복사편집const browser = await browserUse.launch();
const page = await browser.newPage();
await page.goto('https://news.ycombinator.com/');
const articles = await page.$$eval('.titleline a', links => links.map(link => link.innerText));
console.log(articles);
await browser.close();

📝 활용 예시

  • 특정 키워드가 포함된 뉴스만 자동으로 수집 후 Telegram 알림 전송
  • E-Commerce 사이트에서 특정 상품 가격 변동 감지

🎯 2. 자동 로그인 및 웹사이트 조작

✔️ 예제: Gmail 자동 로그인 및 메일 검색

  • ID/PW 입력 후 로그인하여 자동으로 특정 메일을 검색할 수 있음.
  • CAPTCHA가 있다면 AI Solver와 결합하여 자동 해결 가능.

✅ 사용 예제

javascript복사편집await page.type('#identifierId', 'your-email@gmail.com');
await page.click('#identifierNext');
await page.waitForSelector('input[type="password"]');
await page.type('input[type="password"]', 'your-password');
await page.click('#passwordNext');
await page.waitForNavigation();
console.log('로그인 완료');

📝 활용 예시

  • 특정 웹사이트 로그인 후 데이터 다운로드
  • 자동 로그인을 이용한 매크로 작업 (예: 온라인 강의 자동 출석)

🎯 3. 다중 계정 관리

✔️ 예제: 여러 계정으로 SNS 자동화

  • Twitter, Instagram, Facebook 등의 계정 여러 개를 유지하면서 자동화 가능.
  • 각 브라우저 세션이 독립적이므로 쿠키와 세션 충돌 없이 실행 가능.

✅ 사용 예제

javascript복사편집const browser1 = await browserUse.launch({ userDataDir: './user1' });
const page1 = await browser1.newPage();
await page1.goto('https://twitter.com/login');

const browser2 = await browserUse.launch({ userDataDir: './user2' });
const page2 = await browser2.newPage();
await page2.goto('https://twitter.com/login');

📝 활용 예시

  • 여러 개의 SNS 계정으로 자동 포스팅
  • E-commerce 다중 계정 운영 (예: 쿠팡, G마켓 자동 로그인 및 재고 확인)

🎯 4. UI 테스트 자동화

✔️ 예제: 웹사이트 UI 자동 테스트

  • 개발자가 만든 웹 애플리케이션이 정상적으로 동작하는지 확인할 수 있음.
  • 버튼 클릭, 입력, 페이지 이동 등 UI 테스트 시나리오를 작성하여 자동화 가능.

✅ 사용 예제

javascript복사편집await page.goto('https://your-website.com');
await page.click('#login-button');
await page.type('#username', 'testuser');
await page.type('#password', 'password123');
await page.click('#submit');
await page.waitForNavigation();
console.log('로그인 테스트 성공');

📝 활용 예시

  • 프론트엔드 개발자가 배포 전에 UI 자동 테스트 실행
  • 쇼핑몰 결제 프로세스 테스트 자동화

🎯 5. 특정 사이트 자동화 (예: 예약, 티켓팅)

✔️ 예제: 영화 예매 자동화

  • 특정 사이트에서 예매가 열리면 자동으로 좌석을 선택하고 결제 가능.

✅ 사용 예제

javascript복사편집await page.goto('https://cinema-site.com');
await page.click('#movie-select');
await page.select('#time-slot', '19:00');
await page.click('#seat-selection');
await page.click('#confirm-payment');
console.log('영화 예매 완료');

📝 활용 예시

  • 콘서트 티켓팅 자동화
  • 병원 예약 자동화

🎯 6. API 트래픽 분석 및 보안 테스트

✔️ 예제: 특정 사이트의 API 요청 자동 수집

  • 웹사이트에서 실행되는 모든 네트워크 요청을 기록하여 API 트래픽을 분석 가능.
  • 이를 활용하면 웹 보안 및 취약점 테스트(예: CSRF, XSS) 수행 가능.

✅ 사용 예제

javascript복사편집page.on('request', request => console.log('Request:', request.url()));
page.on('response', response => console.log('Response:', response.url()));
await page.goto('https://target-site.com');

📝 활용 예시

  • 특정 API가 요청하는 데이터 구조 분석 (예: 로그인 API, 결제 API)
  • 보안 테스터가 웹사이트의 취약점 점검

🎯 7. VPN 및 프록시 우회

✔️ 예제: 프록시 서버를 사용한 익명 브라우징

  • 특정 국가에서만 접속 가능한 사이트에 접근할 때 유용함.
  • 프록시를 설정하여 IP 차단 우회 가능.

✅ 사용 예제

javascript복사편집const browser = await browserUse.launch({
  args: ['--proxy-server=http://proxy-ip:port']
});

📝 활용 예시

  • 지역 제한이 걸린 사이트에 접속 (예: 해외 한정 스트리밍 서비스)
  • 크롤링 탐지를 우회하여 데이터를 수집

🎯 8. 채팅봇 및 고객 응대 자동화

✔️ 예제: 웹사이트 챗봇 자동 응답

  • 고객 문의를 자동 응답하는 챗봇을 구현할 수 있음.
  • Telegram, Discord 등의 API와 연동하여 자동 채팅 가능.

✅ 사용 예제

javascript복사편집await page.type('#chat-input', '안녕하세요! 무엇을 도와드릴까요?');
await page.click('#send-button');

📝 활용 예시

  • 웹사이트에 AI 챗봇 자동 응답 구현
  • Telegram과 연동하여 실시간 채팅 자동화

🎯 9. 광고 및 마케팅 자동화

✔️ 예제: 자동 댓글 및 좋아요

  • 특정 SNS 플랫폼에서 자동으로 댓글을 달거나 좋아요를 누를 수 있음.
  • 이를 활용하여 마케팅 자동화를 구축 가능.

✅ 사용 예제

javascript복사편집await page.goto('https://instagram.com/someprofile');
await page.click('.like-button');
await page.type('.comment-box', '좋은 게시물이네요!');
await page.click('.submit-comment');

📝 활용 예시

  • 인스타그램, 트위터 자동 댓글 및 좋아요
  • 상품 리뷰 자동화

위와 같은 것들을 할 수 있지요.

자 그럼 설치방법을 안내해 보겠습니다.

📌 Windows에서 browser-use 설치 방법 (단계별 가이드)

Windows 환경에서 browser-use를 설치하고 실행하는 방법을 단계별로 안내합니다.


🚀 1. 필수 요구 사항 확인

설치를 진행하기 전에 필요한 도구가 설치되어 있는지 확인하세요.

🔹 ✅ Node.js 설치

browser-use는 Node.js 기반으로 실행되므로, 먼저 Node.js를 설치해야 합니다.

  1. Node.js 공식 웹사이트에 접속합니다.
  2. LTS (Long-Term Support) 버전을 다운로드합니다.
  3. 설치 파일을 실행하고 기본 설정으로 설치를 완료합니다.
  4. 설치 후, 명령 프롬프트(CMD) 또는 PowerShell을 열어 다음 명령어를 입력하여 정상 설치 여부를 확인합니다.powershell복사편집node -v npm -v 예시 출력:scss복사편집v18.16.0 (Node.js 버전) 9.5.1 (npm 버전)

🔹 ✅ Git 설치 (필요한 경우)

browser-use 저장소를 클론(clone)하려면 Git이 필요합니다.

  1. Git 공식 웹사이트에서 최신 버전을 다운로드합니다.
  2. 설치 파일을 실행하고 기본 설정으로 설치합니다.
  3. 설치 후, 명령 프롬프트(CMD) 또는 PowerShell을 열어 다음 명령어를 입력하여 정상 설치 여부를 확인합니다.powershell복사편집git --version 예시 출력:nginx복사편집git version 2.41.0.windows.1

🚀 2. browser-use 다운로드 및 설치

이제 browser-use를 다운로드하고 실행할 준비를 합니다.

🔹 ✅ browser-use 클론 (Git 사용)

PowerShell 또는 CMD에서 실행

powershell복사편집git clone https://github.com/browser-use/browser-use.git
cd browser-use

위 과정이 끝나면 browser-use 폴더로 이동합니다.

🔹 ✅ 의존성 패키지 설치

powershell복사편집npm install
  • 이 명령어는 package.json에 정의된 모든 필수 모듈을 설치합니다.
  • 정상적으로 설치되면 node_modules 폴더가 생성됩니다.

🚀 3. browser-use 실행

이제 browser-use를 실행할 차례입니다.

🔹 ✅ 실행 명령어

powershell복사편집npm start
  • 실행이 성공하면 콘솔에 서버 실행 메시지가 출력됩니다.

✅ 기본 포트: http://localhost:3000
✅ Web UI 접속: 브라우저를 열고 http://localhost:3000으로 접속


🚀 4. 추가 설정 및 구성

🔹 ✅ 포트 변경

기본 포트(3000)을 변경하려면 .env 파일을 수정하거나 실행할 때 환경 변수를 설정할 수 있습니다.

1) .env 파일 수정

ini복사편집PORT=8080

2) 실행할 때 직접 포트 설정

powershell복사편집set PORT=8080 && npm start

🚀 5. browser-use를 백그라운드에서 실행

🔹 ✅ pm2를 사용하여 실행 (권장)

pm2는 Node.js 애플리케이션을 백그라운드에서 실행하는 도구입니다.

  1. pm2 설치powershell복사편집npm install -g pm2
  2. browser-use 실행powershell복사편집pm2 start npm --name "browser-use" -- start
  3. 실행 확인powershell복사편집pm2 list
  4. 시스템 시작 시 자동 실행 설정powershell복사편집pm2 startup pm2 save

🚀 6. 방화벽 및 네트워크 설정 (선택 사항)

만약 원격에서 browser-use에 접속하려면 Windows 방화벽에서 포트를 열어야 합니다.

🔹 ✅ Windows 방화벽에서 포트 열기

powershell복사편집netsh advfirewall firewall add rule name="browser-use" dir=in action=allow protocol=TCP localport=3000

✅ 사용자 컴퓨터에서 http://<IP>:3000 으로 접속 가능


🚀 7. 실행 및 테스트

설치가 끝났다면, 웹 브라우저에서 http://localhost:3000을 입력하여 browser-use Web UI가 정상적으로 작동하는지 확인하세요.

✅ 실행 후 정상적으로 로딩되면, browser-use를 활용하여 웹 자동화 및 크롤링을 진행할 수 있습니다.


🎯 정리

단계설명
1. 필수 요구 사항 확인Node.js 및 Git 설치
2. browser-use 다운로드Git으로 소스 코드 클론
3. 의존성 설치npm install 실행
4. 실행npm start 또는 pm2 사용
5. 포트 변경 (선택 사항).env 파일 수정 또는 실행 시 환경 변수 설정
6. 방화벽 설정 (선택 사항)Windows 방화벽에서 포트 열기
7. 테스트http://localhost:3000 접속


옵시디언(Obsidian) 이제 업무용으로도 무료 사용 가능!

그동안 개인 사용자는 무료였던 옵시디언, 그러나 업무용으로 사용하려면 라이선스 문제가 있었습니다.
그러나 20일 부터는 상업적 사용도 무료로 라이선스가 변경되었습니다.

자세한 내용은 아래 원문과 번역본을 참고해 주세요.

번역본

Obsidian 상업 라이선스가 선택 사항으로 변경되었습니다.

오늘부터 Obsidian의 상업 라이선스(Commercial License)가 선택 사항이 됩니다. 이제 누구나 업무용으로 무료로 Obsidian을 사용할 수 있습니다.
Obsidian이 귀하의 조직에 도움이 된다면, 여전히 상업 라이선스를 구매하여 개발을 지원할 수 있습니다.

변경되는 사항

✔ 아무것도 달라지지 않습니다.
✔ 계정이 필요하지 않습니다.
✔ 광고 없음, 추적 없음, 숨겨진 조건 없음.
✔ 데이터는 사용자의 완전한 통제 하에 있으며, 로컬에 Markdown 파일로 저장됩니다.
✔ 모든 기능을 제한 없이 무료로 사용할 수 있습니다.

왜 이러한 변화를 선택했을까요?

단순함(Simplicity) 때문입니다. 기존의 상업 라이선스 정책은 혼란을 초래하고 가격 구조를 불필요하게 복잡하게 만들었습니다. 또한, **Obsidian Manifesto(Obsidian 선언문)**에서 밝힌 바와 같이,

“우리는 모든 사람들이 명확하게 사고하고 효과적으로 아이디어를 정리할 수 있는 도구를 가져야 한다고 믿습니다.”
이러한 원칙을 더욱 충실히 따르기 위한 결정입니다.

10,000개 이상의 조직에서 Obsidian을 사용하고 있습니다.

Obsidian은 정부, 사이버 보안, 의료, 금융과 같은 보안이 중요한 환경에서 널리 사용됩니다.
Amazon과 Google을 포함한 세계 최대 규모의 조직에서도 수천 명의 직원이 매일 Obsidian을 사용하고 있습니다.
이 팀들은 보다 효과적으로 사고하고, 데이터의 완전한 소유권을 유지하기 위해 Obsidian을 신뢰합니다.

상업 라이선스가 선택 사항으로 변경됩니다.

기존에는 직원이 2명 이상인 기업이 Obsidian을 업무용으로 사용하려면 상업 라이선스를 구매해야 했습니다.
하지만 이제는 필수가 아니라 선택 사항입니다. 다만, 조직이 Obsidian을 지원하고 싶다면 여전히 라이선스를 구매할 수 있습니다.
이는 개인 사용자용 Catalyst 라이선스와 유사한 방식입니다.

또한, Obsidian을 지원하는 조직은 ‘Obsidian Enterprise’ 페이지에서 소개됩니다.
귀사의 로고를 여기에 표시하려면 25개 이상의 라이선스를 구매하면 됩니다.

Obsidian은 100% 사용자 지원으로 운영됩니다.

Obsidian은 여전히 Sync, Publish와 같은 추가 서비스를 통해 운영됩니다.
미래에는 팀을 위한 추가 서비스를 제공할 계획이지만, 이 역시 선택 사항으로 남을 것입니다.

💜 Obsidian을 사랑해 주셔서 감사합니다!

Suno의 경쟁자 음악 생성 AI 리퓨전(riffusion) – 현재 무료

suno ai는 음악 생성 AI로 너무나도 유명하죠. 버전 업데이트를 할 수록 막강해지는 음악 생성으로, 이제는 어느정도 궤도에 올라온것 같습니다. (무료 티어와 유료 티어의 차이도 있고 ㅠㅠ)

이러한 음악 생성 AI시장에 혜성처럼 등장한 리퓨전은 현재 베타 버전이지만 무료로 충분히 경쟁력있는 고음질 음악을 생성할 수 있습니다.

아직까지 음질은 suno가 좀 더 낫다는 평가를 받고 있지만, 무료/유료 티어 차이가 없는 리퓨전도 한번 사용해 보시는게 어떨까 싶습니다.

해외직구 디지털 도어록 안전성 시험결과 – 주요 안전 문제 발견

한국소비자원(원장 윤수현)이 해외직구 플랫폼인 알리익스프레스에서 판매되는 디지털 도어록 10개 제품의 품질 및 안전성을 시험한 상세 결과를 공개했습니다.

1. 시험평가 대상 제품 현황

2. 상세 시험평가 결과

2.1 안전성 평가 결과

평가 항목시험 기준부적합 제품문제점화재 시 열림270℃ 환경에서 수동레버로 문 개방 가능 여부XSDTS(DF14), SANKESONG, YKESDL(D14P)수동레버 녹아내려 대피 불가배터리 안전성화재 시 발화·폭발 여부리튬2차전지 사용 5개 제품 전체170℃~260℃에서 발화·폭발
🔥 화재 시 문 개방 가능 여부도어록을 30분 내에 270℃까지 가열 후 10분 유지 후 꺼내어 수동레버 작동 여부 확인
🔋 배터리 발화 및 폭발 위험성270℃ 이하에서 배터리가 발화·폭발하는지 확인 (온도 범위: 170℃~260℃)
⚡ 비상 전원 공급 기능내부 배터리 방전 후 외부에서 비상 전원 공급이 가능한지 확인
🌡 내환경성고온(55℃), 저온(-15℃), 고습도(40℃, 습도 90%)에서 48시간 노출 후 정상 작동 여부 확인
🔧 설치 호환성국내 표준 타공 규격(KS C 9806)과 비교하여 설치 가능 여부 확인

2.2 품질 평가 결과

평가 항목시험 기준부적합 제품문제점비상외부전원배터리 방전 시 외부 전원 공급 가능 여부Catchface비상전원 공급 단자 없음내환경성고온(55℃), 저온(-15℃), 고습도(40℃, 90%) 환경 내구성없음전 제품 적합

2.3 호환성 평가 결과

평가 항목기준결과영향타공도 호환성KS C 9806 표준 규격전체 제품 부적합추가 설치비용 발생, 이사 시 출입문 교체 필요

3. 조치 사항

3.1 유통차단 대상 제품 (6개)

  1. Catchface(미상)
  2. XSDTS(DF14)
  3. SANKESONG(3D Face Smart Door Lock)
  4. Tropernic(17)
  5. YKESDL(D14P)
  6. 브랜드 미상(H7)

알리익스프레스는 2025.01.09 기준으로 해당 제품들의 판매를 차단 완료

3.2 소비자 환불 절차

  • 대상: 판매차단 시점(2025.01.09) 이전 구매자 총 46명
  • 방법: 알리익스프레스 고객센터(1533-6727) 연락 후 환불 진행

4. 소비자 구매 시 주의사항

  1. 안전성 검증
    • KC안전확인 인증 제품 선택
    • 내화형, 화재 시 열림 기능 확인
  2. 전원 방식 선택
    • 가급적 건전지 사용 제품 선택
    • 리튬2차전지 제품은 KC안전확인 필수 확인
    • 2025년 5월 7일부터 리튬2차전지 사용 가능 (국가기술표준원 고시 제2025-0026호)
  3. 설치 호환성
    • 기존 도어록과의 타공도 호환성 확인
    • 추가 설치 비용 발생 가능성 고려
    • 이사 시 출입문 교체 비용 고려

5. 소비자 피해구제 방법

소비자 피해 발생 시 ‘소비자24 열린소비자포털(www.consumer.go.kr)’ 을 통해 다음 서류를 구비하여 상담 또는 피해구제 신청 가능:

  • 거래내역
  • 증빙서류
  • 기타 관련 자료

n8n: 누구나 쉽게 자동화를 구현하는 오픈소스 워크플로우 자동화 도구

n8n이란?

n8n은 오픈소스 기반의 워크플로우 자동화 도구로, 코드 작성 없이 다양한 서비스와 애플리케이션을 연결하여 자동화된 작업을 수행할 수 있도록 돕는 플랫폼입니다. 이를 통해 사용자는 반복적인 업무를 줄이고, 효율성을 극대화할 수 있습니다.

n8n은 노드(Node) 기반으로 동작하며, 드래그 앤 드롭 방식의 직관적인 UI를 제공하여 비개발자도 쉽게 자동화 흐름을 설계할 수 있습니다. 또한, 자체 호스팅이 가능하므로 데이터 프라이버시를 강화할 수 있으며, 다양한 서드파티 API와의 원활한 연동을 지원합니다.

n8n으로 할 수 있는 일

n8n은 여러 가지 이상적으로 업무에서 반복해야 하는 프로세스를 자동화하는 데 활용할 수 있습니다. 대표적인 활용 사례는 다음과 같습니다.

1. 데이터 연동 및 변환

  • Google Sheets, Airtable, Notion과 같은 데이터베이스를 연동하여 정보를 자동 업데이트
  • JSON, XML, CSV 형식 변환 및 정제 작업
  • API를 활용한 데이터 수집 및 가공

2. 마케팅 및 고객 관리 자동화

  • 이메일 마케팅: 신규 가입자에게 자동으로 이메일 전송 (Mailchimp, SendGrid 등과 연동)
  • CRM 자동화: HubSpot, Salesforce 등의 CRM과 연동하여 고객 데이터를 동기화
  • 소셜미디어 자동화: Instagram, Twitter, Facebook에 게시물 자동 업로드

3. 프로젝트 및 업무 관리

  • Trello, Asana, ClickUp과 같은 프로젝트 관리 도구와 연동하여 자동화된 태스크 생성
  • Slack, Microsoft Teams 알림 자동화
  • Jira 티켓 자동 생성 및 업데이트

4. IT 및 DevOps 자동화

  • GitHub, GitLab 등의 리포지토리 변경 사항 감지 및 알림
  • AWS, Google Cloud, Azure 클라우드 리소스 관리 자동화
  • CI/CD 파이프라인 자동화 (Jenkins, CircleCI 연동)

자, 그럼 어떻게 설치하고 실제 제가 어떻게 활용하고 있는지 살펴봅시다.

version: "3.7"
services:
postgres:
image: postgres:13
restart: always
environment:
- POSTGRES_USER=n8n
- POSTGRES_PASSWORD=패스워드작성
- POSTGRES_DB=n8n
volumes:
- postgres_data:/var/lib/postgresql/data
healthcheck:
test: ["CMD-SHELL", "pg_isready -U n8n"]
interval: 10s
timeout: 5s
retries: 5
n8n:
image: n8nio/n8n:latest
restart: always
ports:
- "5678:5678"
environment:
- N8N_BASIC_AUTH_ACTIVE=true
- N8N_BASIC_AUTH_USER=admin
- N8N_BASIC_AUTH_PASSWORD=패스워드작성
- N8N_HOST=n8.123qwe.co.kr
- WEBHOOK_URL=https://사용할 도메인 혹은 ip 기입
- N8N_PORT=5678
- N8N_PROTOCOL=https
- N8N_ENCRYPTION_KEY=키값 작성
- N8N_SECURE_COOKIE=false
- N8N_ENFORCE_SETTINGS_FILE_PERMISSIONS=true
# PostgreSQL 연결 설정
- DB_TYPE=postgresdb
- DB_POSTGRESDB_HOST=postgres
- DB_POSTGRESDB_PORT=5432
- DB_POSTGRESDB_USER=n8n
- DB_POSTGRESDB_PASSWORD=패스워드작성
- DB_POSTGRESDB_DATABASE=n8n
volumes:
- n8n_data:/home/node/.n8n
depends_on:
postgres:
condition: service_healthy
qdrant:
image: qdrant/qdrant
container_name: qdrant
restart: always
environment:
- QDRANT_API_KEY=키값작성
ports:

저는 위와 같은 형태로 docker-compose.yml 파일을 만들어서 도커로 올렸습니다.

QDRANT_API_KEY키의 경우 벡터 db를 사용하기 위해 별도로 올렸으니, 필요 없으면 안써도 되지만, 워크 플로우를 만들다 보면 의외로 쓸일이 많아서 이 참에 하나 같이 올려주시면 도움이 됩니다.

이건 실제로 제가 가장 많이 사용하는 워크플로우인데요. 설명을 하자면

텔레그램 그룹방에서 봇을 만들어서 “봇 + 명령어” 형태로 동작시키는 워크플로우입니다.

텔레그램 봇파더에게 봇을 하나 만든뒤에 그룹방에 해당 봇을 초대하여 메시지 접근을 수락해 준 뒤에 다음과 같은 명령을 할 수 있어요

봇 날씨

이런식으로 AI 챗봇을 그룹방에 불러 놓고 여러명이서 편하게 사용 하는거죠.

또 다른 예로는,

이러한 형태로 만든 예제가 있습니다.

이 n8n 워크플로우는 Notion 데이터베이스를 검색하고, 결과를 기반으로 AI 에이전트를 활용하여 응답을 생성하는 자동화 프로세스입니다. 주요 기능은 다음과 같습니다:

  1. Notion 데이터베이스 검색
    • 사용자가 Notion 데이터베이스 URL을 입력하면, 해당 데이터베이스의 정보를 가져옵니다.
    • 검색을 통해 관련 정보를 추출하고 정리합니다.
  2. 데이터 정제 및 변환
    • 데이터베이스의 속성을 표준화하고, 필요한 JSON 데이터를 추출하여 처리합니다.
    • 특정 속성을 간소화하여 검색을 최적화합니다.
  3. AI 기반 응답 생성
    • OpenAI GPT 모델을 활용하여 검색된 데이터를 기반으로 적절한 응답을 생성합니다.
    • n8n 에이전트를 통해 검색 질의에 대해 구조화된 답변을 제공합니다.
  4. 자동 JSON 워크플로우 생성 및 검증
    • AI 모델이 Notion 데이터베이스를 기반으로 새로운 워크플로우 JSON을 생성합니다.
    • 생성된 JSON이 올바른 형식인지 검증하고, 오류가 있으면 자동으로 수정합니다.
  5. 채팅 인터페이스와 연동
    • 사용자의 입력을 기반으로 워크플로우를 실행하고, Slack 또는 Telegram 같은 채팅 플랫폼으로 응답을 반환할 수 있도록 설계됨.

즉, 이 워크플로우는 Notion 데이터베이스의 정보를 검색하고 AI를 활용하여 사용자 맞춤형 응답을 자동으로 생성하는 기능을 수행합니다. 🚀

마지막으로 하나 더 살펴보자면,

이 n8n 워크플로우는 이메일 자동 처리 및 응답 생성을 위한 자동화 프로세스입니다. 주요 기능은 다음과 같습니다:

1. 이메일 수신 및 처리

  • IMAP 트리거를 사용하여 특정 이메일 계정에서 수신된 메일을 감지합니다.
  • 이메일 본문을 Markdown 형식으로 변환하여 자연어 처리에 적합하게 변환합니다.
  • 요약 체인을 통해 이메일 내용을 간결하게 요약합니다.

2. AI 기반 이메일 응답 생성

  • 요약된 이메일 내용을 기반으로 AI (GPT-4o-mini) 모델이 적절한 응답을 자동으로 생성합니다.
  • 생성된 이메일이 비즈니스 용도로 적절한지 텍스트 분류기를 사용하여 검토합니다.
  • 필요 시, 이메일을 재작성하는 리뷰 프로세스를 거칩니다.

3. 이메일 전송 및 승인

  • 생성된 이메일을 Gmail API를 통해 자동으로 전송합니다.
  • 이메일을 전송하기 전에 승인 요청을 수행하여 사람이 검토 후 최종 전송할 수 있도록 합니다.

4. 벡터 데이터베이스 활용 (Qdrant)

  • 비즈니스 관련 정보를 검색하고 활용하기 위해 Qdrant 벡터 데이터베이스를 사용합니다.
  • OpenAI 임베딩 모델을 활용하여 이메일 내용과 관련된 정보를 추출할 수 있습니다.

결론

이 워크플로우는 비즈니스 이메일을 자동으로 요약하고, AI 기반으로 응답을 생성한 후, 승인 또는 자동 전송하는 자동화 프로세스입니다. 이를 통해 이메일 처리 시간을 단축하고, 보다 효율적인 고객 응대가 가능합니다. 🚀

저도 처음에 n8n을 서버에 설치하고 나서, 이걸로 대체 무엇을 할 수 있을까 막막했어요, 유툽도 많이 찾아 봤지만, 별 도움이 안되더라구요.

하지만, https://n8n.io/workflows/?utm_source=n8n_app&utm_medium=template_library&utm_instance=https%3A%2F%2Fn8.123qwe.co.kr%2F&utm_n8n_version=1.78.1&utm_awc=5&utm_user_role=business-owner 이곳에 들어가보면

이미 많은 사람들이 자신들의 워크플로우를 만들어서 공유를 하고 있습니다.

관심있는 워크플로우 몇개 설치해 보면서 감을 잡으시면 큰 도움이 되는데,

초보라면 몇가지 개념이 많이 혼동스럽습니다. 크리덴셜? 웹훅? 노드id 등등..
이러한 개념을 알고 진행하시면 큰 도움이 됩니다.

n8n의 핵심 개념 정리

  1. 크리덴셜 (Credential)
    • 외부 서비스(API, 데이터베이스, 이메일 등)와 연결할 때 필요한 인증 정보입니다.
    • 예: API 키, OAuth 토큰, 로그인 정보 등.
    • 설정 후 여러 **노드(Node)**에서 재사용 가능.
  2. 노드 (Node)
    • n8n에서 **각각의 작업(작업 단위)**을 의미합니다.
    • 데이터 처리, API 호출, 파일 관리, 조건 분기 등의 역할을 수행.
    • 예: 이메일 전송 노드, HTTP 요청 노드, 데이터베이스 쿼리 노드 등.
  3. 워크플로우 (Workflow)
    • 여러 개의 노드를 연결하여 자동화된 작업 흐름을 구성한 것입니다.
    • 시작 노드(Trigger) → 데이터 처리 노드 → 결과 출력 노드 등의 구조.
    • 예: 새 이메일 수신 → 내용 요약 → Slack 알림 전송.
  4. 웹훅 (Webhook)
    • 외부 서비스에서 특정 이벤트가 발생할 때 n8n 워크플로우를 실행하는 트리거입니다.
    • HTTP 요청을 받아 자동으로 실행됨.
    • 예: 신규 고객 가입 시 고객 정보를 DB에 저장하는 워크플로우 실행.
  5. 트리거 (Trigger)
    • 워크플로우를 자동으로 실행하는 시작점 역할을 하는 노드.
    • 웹훅, 크론잡(스케줄러), IMAP 이메일 수신 등 다양한 방식이 있음.
    • 예: 매일 아침 9시에 데이터를 가져오는 일정 기반 트리거.

그리고 진짜 꿀팁은 바로 이건데요….
타인의 워크플로우를 넣건, 내가 만들었건, 각 노드에서 계속 오류 나다 보면 금방 포기하고 싶어지거든요

그때는 워크플로우 화면을 한번 클릭하고 컨트롤+c를 누르면 json 코드 형태로 워크플로우가 복사가 되어 클립보드에 저장이 됩니다.

이렇게 저장된 내용을 챗gpt나 클로드 그리고 요즘 무료로 많이 사용이 가능한 구글 ai스튜디오에 가서 붙여 넣고 오류에 대해 해결해 달라고 하거나 오류 원인을 물어 보면 하나 하나 해결해 나가실 수 있습니다.

🌟콩알금 투자 OR KRX로 현실적인 금 투자하기!

📌 목차

  1. 서론: 실물 금? 무조건 좋은 선택은 아니다!
  2. 실물 콩알금, 생각보다 비효율적인 이유
  3. KRX 금 시장 vs 실물 금 투자 비교
  4. KRX 금 시장, 어떻게 시작할까?
  5. 콩알금 vs KRX 금 투자, 무엇이 더 현실적일까?
  6. 결론: 금 투자, 제대로 하려면 KRX로!

1️⃣ 실물 금? 무조건 좋은 선택은 아니다!

금은 안전자산으로 평가받지만, 콩알금(소량의 실물 금)을 모으는 것이 정말 최선의 선택일까요?
많은 사람들이 작은 단위로 금을 사 모으지만, 매번 부가세 10%를 내야 하는 함정이 있습니다. 즉, 사자마자 손실을 보고 시작하는 셈이죠.

💡 더 나은 대안은?

주식처럼 KRX 금 시장을 이용하는 것! 실물 금보다 수수료와 세금 부담이 훨씬 적고, 안전한 방식으로 금에 투자할 수 있습니다.

이 글에서는 콩알금 투자 방법, 단점과 해결책, 그리고 KRX 금 투자법까지 현실적인 해결책을 알려드립니다! 🏆


2️⃣ 실물 콩알금, 생각보다 비효율적인 이유 🤔

🔹 구매 시 부가세 10% 발생: 실물 금은 구매 시 부가세 10%를 내야 합니다.
🔹 재판매 시 손해 가능성: 금은방이나 은행에서 매도할 때, 매입 가격이 시세보다 낮아 손실이 발생할 수 있음.
🔹 보관의 불편함: 보관할 때 분실 위험이 있으며, 금고 대여 시 추가 비용 발생.
🔹 환금성 제한: 현금화하려면 반드시 매입처를 찾아야 하며, 즉시 매도하기 어려운 경우도 있음.

💡 대안? KRX 금 시장 활용!


3️⃣ KRX 금 시장 vs 실물 금 투자 비교 📊

투자 방식장점단점
실물 콩알금직접 보유 가능, 선물용으로 활용부가세 10%, 보관 부담, 환금성 낮음
KRX 금 시장부가세 없음, 수수료 저렴, 즉시 매매 가능실물이 아닌 계좌 투자 방식

결론: 실물 금을 모으는 것은 낭만적이지만, 투자 목적으로는 KRX 금 시장이 훨씬 현실적인 대안입니다.


KRX시장에서 거래하면 부가가치세가 면제! (단, 실물 금으로 교환시 부과)


4️⃣ KRX 금 시장, 어떻게 시작할까? 🏦

1️⃣ 증권사 금 거래 계좌 개설 (미래에셋, 키움증권 등)
2️⃣ KRX 금 시장에서 1g 단위로 매수 가능
3️⃣ 실물 인출도 가능 (단, 일정량 이상 보유 시)
4️⃣ 수수료가 낮고, 부가세 없이 금을 보유 가능

부가세 없이 실물 금에 투자할 수 있는 유일한 방법!



5️⃣ 콩알금 vs KRX 금 투자, 무엇이 더 현실적일까? 🤔

🔹 실물 콩알금: 직접 보유의 만족감은 있지만, 초기 10% 손실이 발생하며, 보관 및 매매가 불편함.
🔹 KRX 금 시장: 세금 부담이 없고, 거래가 편리하며, 실물 인출까지 가능.

투자 목적으로는 KRX 금 시장이 가장 현실적인 선택!


6️⃣ 결론: 금 투자, 제대로 하려면 KRX로! 🚀

📌 핵심 요약

실물 콩알금 투자, 부가세 10%로 손실부터 시작!
KRX 금 시장은 세금 부담 없이 현실적인 투자 방법
증권사에서 금 계좌 개설 후 간편하게 거래 가능

🎯 이제 실물 콩알금보다, KRX 금 시장으로 제대로 투자하세요!

홈랩 구축을 위한 Proxmox, NPM, WordPress, n8n의 조합

오늘날 기술적 환경이 변화함에 따라 많은 사용자들이 개인 서버를 구축하여 다양한 서비스를 운영하고자 합니다. 이러한 홈랩 구축을 위해 최고의 선택 중 하나는 Proxmox, NPM, WordPress, 그리고 n8n의 조합입니다. 이 글에서는 각 소프트웨어의 기능과 함께 이들을 통합하여 사용할 때 얻을 수 있는 이점에 대해 설명하겠습니다.

Proxmox는 가상화 플랫폼으로, 여러 가상 머신을 손쉽게 관리할 수 있도록 돕습니다. 이는 물리적 서버를 효율적으로 활용하고 필요에 따라 다양한 환경을 구축할 수 있게 합니다. NPM은 JavaScript 패키지 관리자로, WordPress와 n8n을 포함한 여러 프로젝트에서 필수적인 역할을 합니다. WordPress는 웹사이트 구축과 관리에 강력한 도구로 자리잡았으며, n8n은 비즈니스 프로세스 자동화를 가능하게 하는 유연한 워크플로우 오케스트레이션 플랫폼입니다.

이 조합은 각각의 소프트웨어가 제공하는 독특한 기능을 활용하여 서로의 장점을 극대화할 수 있습니다. 예를 들어, Proxmox를 통해 가상 서버를 운영하여 WordPress 웹사이트를 호스팅하고, n8n을 활용해 자동화된 프로세스를 설정하는 것이 가능합니다. 이러한 통합된 접근 방식은 비용 효율적이고 유연한 솔루션을 제공하며, 기술적 경량화에 기여할 수 있습니다. 이 기사를 통해 각 소프트웨어의 특성과 이를 활용하여 홈랩을 구축하는 방법을 알아보겠습니다.

Proxmox의 이해와 설치

Proxmox의 설치를 통해 가정에서 서버 환경을 구성하고 가상화된 인프라를 만드는 첫 단계를 쉽게 진행할 수 있습니다. 이제 다음 단계로, Proxmox에서 구축한 가상 머신을 통해 다양한 서비스를 운영하며, 사용자 요구에 맞는 집약적인 서버 솔루션을 만드는 방법에 대해서 살펴보겠습니다. 여기에서는 NPM, WordPress, n8n을 활용하여 고도의 통합된 홈랩 구축을 목표로 합니다. 이러한 서비스 간의 조합을 통해 효율적인 웹 애플리케이션을 배포하고 자동화를 구현할 수 있습니다.

Proxmox에서 가상화를 통해 Linux 기반의 가상 서버를 구축했다면, 이후 NPM(Node Package Manager)을 활용하여 JavaScript 기반의 패키지들을 관리하는 것이 중요합니다. NPM은 웹 애플리케이션을 구축할 때 필요한 다양한 라이브러리와 모듈을 효율적으로 관리할 수 있도록 도와줍니다. 이는 특히 WordPress 같은 CMS(콘텐츠 관리 시스템)에서 플러그인과 테마를 설치하고 관리하는 데 필수적입니다. NPM을 이용하면 사이트의 기능을 쉽게 확장할 수 있으며, 종속성을 자동으로 해결하여 프로젝트의 생산성을 높입니다.

이제 NPM을 통해 WordPress 프로젝트를 준비할 차례입니다. 먼저, Proxmox 내에 가상 머신을 생성하고 그 위에 필요한 운영체제를 설치한 후, Node.js와 NPM을 설치해야 합니다. 설치가 완료되면, 프로젝트 루트 디렉토리에서 ‘npm init’ 명령어를 사용하여 프로젝트를 초기화합니다. 초기화가 완료되면, 필요한 플러그인이나 테마를 설치하기 위해 ‘npm install <패키지명>‘ 명령어를 사용합니다. 예를 들어, 특정 테마를 적용하기 위해테마 패키지를 설치한 후, WordPress 관리 패널에서 이를 활성화하면 됩니다.

그 후, n8n과 같은 오픈 소스 자동화 툴을 통합하여 작업을 더욱 간소화할 수 있습니다. n8n은 다양한 API 및 서비스를 연결하여 워크플로우를 자동화하는 데 매우 유용합니다. Proxmox 가상 머신에서 n8n을 설정하면, 이메일 자동화, 데이터 통합, 알림 시스템 등 다양한 자동화 작업을 구성할 수 있습니다. 예를 들어, WordPress에서 신규 포스트가 작성될 때마다 특정 채널로 알림이 전송되도록 하거나, 사용자의 피드백을 자동으로 수집하는 작업을 설정할 수 있습니다.

n8n의 설치는 비교적 간단하며, Docker 또는 npm을 통해 설치할 수 있습니다. 설치 후 n8n의 웹 인터페이스에 접속하여 다양한 노드를 설정하고 이를 조합함으로써, 원하는 자동화 워크플로우를 완성할 수 있습니다. n8n을 통해 프로세스를 자동화하면 수작업으로 처리해야 하는 시간과 노력을 줄일 수 있으며, 여러 서비스를 효율적으로 통합하여 보다 나은 사용자 경험을 제공할 수 있습니다.

결국, Proxmox와 NPM, WordPress, 그리고 n8n의 조합은 가정에서의 서버 구성뿐만 아니라, 다양한 서비스를 유기적으로 연결하여 최적의 솔루션을 제공합니다. 이러한 통합된 환경에서는 서버 관리, 웹 애플리케이션 운영, 업무 프로세스 자동화가 효율적으로 이루어지며, 개인의 기술적 요구사항도 충족시킬 수 있습니다. 이는 결국 개인의 홈랩을 통해 보다 전문적인 서버 환경을 구축하고 유연한 서비스를 제공하는 기초가 됩니다. 다음 장에서는 이러한 조합에서 NPM과 WordPress 간의 효과적인 연계를 다루어, 웹사이트의 성능을 더욱 향상시키는 방법에 대해 논의할 것입니다.

NPM과 WordPress 연계

NPM은 JavaScript 생태계에서 가장 널리 사용되는 패키지 관리자로, 다양한 프론트엔드와 백엔드 애플리케이션의 개발에 필수적인 도구입니다. 특히 WordPress와 같은 콘텐츠 관리 시스템(CMS)에서도 NPM은 중요한 역할을 수행합니다. 이 장에서는 WordPress 사이트 구축 시 NPM을 활용하여 필요한 플러그인과 테마를 설치하고 관리하는 방법에 대해 깊이 있게 탐구하겠습니다.

WordPress는 기본적으로 사용자가 쉽게 콘텐츠를 생성하고 관리할 수 있도록 설계되었습니다. 그러나 기본 테마와 플러그인으로는 특정 요구 사항을 충족하지 못할 수 있기 때문에, 개발자는 NPM을 통해 더 많은 기능과 디자인 요소를 추가할 수 있습니다. NPM을 사용하면 손쉽게 다양한 라이브러리를 설치하고 이를 WordPress 프로젝트에 통합할 수 있으며, 이는 사이트의 성능과 사용자 경험을 크게 향상시킬 수 있습니다.

먼저, NPM을 사용해 WordPress 프로젝트를 설정하는 방법을 살펴보겠습니다. 새 WordPress 프로젝트를 시작하려면 먼저 해당 프로젝트의 루트 디렉토리에서 NPM을 초기화해야 합니다. 이를 위해 ‘npm init’ 명령을 사용하여 package.json 파일을 생성합니다. 이 파일은 프로젝트의 메타데이터를 포함하고, 설치할 패키지에 대한 정보를 담고 있습니다. 패키지.json 파일이 생성되면 필요한 플러그인과 테마를 추가하기 위해 ‘npm install [패키지명]’ 명령어를 사용하여 설치할 수 있습니다.

예를 들어, 인기 있는 외부 라이브러리인 jQuery를 설치하려면 ‘npm install jquery’라고 입력하면 되며, 이는 WordPress의 테마 또는 플러그인 코드에서 사용할 수 있습니다. 이렇게 설치한 jQuery는 스크립트를 통해 다양한 인터랙티브한 기능을 사이트에 추가하고 사용자 경험을 풍부하게 만들어줄 수 있습니다.

또한, NPM을 사용하여 여러분의 WordPress 프로젝트에 Vue.js와 같은 모던 프론트엔드 프레임워크를 통합할 수도 있습니다. 이를 통해 역동적이고 즉각적인 사용자 인터페이스를 제공할 수 있으며, 이는 사용자 몰입도를 높이는 데 큰 도움을 줍니다. 예를 들어, 비동기식 통신을 통해 게시물 데이터를 가져와 실시간으로 업데이트된 콘텐츠를 사용자에게 제공할 수 있습니다. NPM을 통해 설치한 모든 라이브러리는 프로젝트 내에서 쉽게 불러올 수 있어, 코드 관리가 보다 효율적으로 이루어집니다.

NPM을 통해 설치한 패키지는 언제든지 간편하게 업데이트할 수 있습니다. ‘npm update’ 명령어를 사용하면 최신 버전의 패키지로 일괄 업그레이드를 진행하게 되며, 이를 통해 보안 취약성을 예방하고 최신 기능을 적용할 수 있습니다. 이러한 점은 프로젝트의 장기적인 유지보수와 성능 향상에 매우 중요합니다.

WordPress에서 NPM을 활용하는 방법은 주로 프론트엔드 개발에 국한되지 않습니다. 서버 측에서도 NPM을 사용하여 다양한 패키지를 관리하고, 이를 통해 특정 기능을 구현할 수 있습니다. 예를 들어, NPM을 사용하여 REST API와 통신하는 플러그인을 작성하거나, 커스텀 테마의 빌드 프로세스를 자동화하여 효율성을 높일 수 있습니다. 이를 통해 개발자는 표준화된 환경을 구축하고, 팀 간의 협업을 원활하게 진행할 수 있습니다.

결론적으로, NPM은 WordPress 개발에서 필수적인 도구로 자리 잡고 있습니다. NPM을 통해 요구하는 기능을 쉽게 추가하고 관리하며, 사이트 성능을 개선할 수 있는 다양한 옵션을 제공받을 수 있습니다. 이 다음 장에서는 n8n을 통한 프로세스 자동화에 대해 자세히 알아볼 것이며, NPM 및 WordPress와의 조화로운 결합이 직관적인 자동화 작업 흐름을 어떻게 가능하게 하는지 살펴보겠습니다.

n8n을 통한 프로세스 자동화

n8n은 강력한 워크플로우 자동화 도구로, 다양한 애플리케이션과 서비스 간의 상호작용을 지원하여 복잡한 비즈니스 프로세스를 단순화합니다. 사용자는 n8n의 직관적인 인터페이스를 통해 비주얼 방식으로 작업 흐름을 정의하고 설정할 수 있으며, 이를 통해 업무의 효율성을 극대화할 수 있습니다. n8n은 클라우드 서비스에서 호스팅할 수도 있지만, 홈랩 구축 환경에서 Proxmox를 통해 직접 배포하는 것도 가능합니다. Proxmox와 n8n의 조합은 개발 환경이나 개인 프로젝트에서 작업을 자동으로 처리할 수 있는 유연성을 제공합니다.

n8n의 설정 과정은 특히 수월하여 기술적인 배경이 없는 사용자도 쉽게 접근할 수 있습니다. 사용자는 다양한 트리거를 설정하여 특정 이벤트가 발생했을 때 자동으로 작업을 실행할 수 있습니다. 예를 들어, WordPress 블로그에 새로운 글이 게시될 때 이를 소셜 미디어 플랫폼에 자동으로 공유하도록 설정할 수 있습니다. 트리거와 작업은 드래그 앤 드롭 방식으로 쉽게 연결할 수 있으며, 각 단계에서 필요한 데이터 조작도 가능하므로 더 정교한 워크플로우를 구축할 수 있습니다.

n8n은 여러 서비스 간의 연결성을 극대화하는 데 강점을 지니고 있습니다. 예를 들어, 이메일 마케팅 서비스와 CRM 시스템을 연동하여, 새로운 고객이 가입할 때 자동으로 환영 이메일을 보내고 대신 연락처 정보를 CRM에 등록하는 프로세스를 설정할 수 있습니다. 이러한 자동화는 작업의 중복성을 줄이면서도 고객 경험을 향상시킬 수 있는 훌륭한 방법입니다.

또한 n8n은 기본적으로 오픈소스이며, 여러 플러그인을 통해 다양한 서비스와의 통합이 가능합니다. 사용자는 GitHub 또는 n8n 커뮤니티에서 개발된 커넥터를 활용하여 필요에 따라 기능을 확장할 수 있습니다. 예를 들어, Google Sheets와의 연계를 통해 팀이 프로젝트 상태를 모니터링하거나, Zapier 및 IFTTT와 같은 기존의 자동화 플랫폼과 비교해 더 세밀한 작업 흐름을 설계할 수 있습니다.

n8n을 활용한 자동화의 또 다른 장점은 실시간 데이터 흐름 관리입니다. 사용자는 각 단계에서 전달되는 데이터가 어떻게 변화하는지를 명확하게 파악할 수 있으며, 이를 통해 원하는 결과를 얻기 위해 필요한 조정이 가능합니다. 각 워크플로우에서는 각 작업의 성공과 실패 여부를 확인할 수 있는 대시보드가 제공되므로 관리와 모니터링이 용이합니다.

이 장에서는 특정 워크플로우의 예시를 통해 n8n의 강력한 기능을 더욱 구체적으로 설명하겠습니다. 예를 들어, 온라인 쇼핑몰을 운영하는 경우, 고객이 새로운 주문을 했을 때 발생하는 일련의 작업을 자동화하는 과정을 살펴보겠습니다. 이 과정에서 n8n을 사용하여 고객에게 자동으로 확인 이메일을 보내고, 재고를 업데이트하며, 회계 소프트웨어에 주문 정보를 기록하도록 설정할 수 있습니다. 이를 통해 인력 자원 절약은 물론, 오류 발생 가능성을 최소화할 수 있습니다.

n8n은 이러한 방식으로 단순히 반복적인 작업을 자동화하는 것을 넘어, 비즈니스의 총체적 운영 효율성을 크게 향상시킬 수 있는 도구입니다. 특히 홈랩 환경에서 설치하고 운영할 수 있다면, 기존의 클라우드 기반 서비스 의존도를 줄이면서도 커스터마이징된 솔루션을 통해 나만의 자동화 시스템을 구축할 수 있습니다. 앞으로의 챕터에서는 이러한 n8n의 활용 사례와 함께, Proxmox 서버와의 통합 방법에 대해 더 자세히 안내드리겠습니다.

Conclusions

홈랩 구축은 단순히 기술적인 도전이 아닙니다. Proxmox, NPM, WordPress, n8n의 조합은 개인의 요구에 맞는 맞춤형 서버 환경을 만드는 데 큰 도움이 됩니다. 각 소프트웨어는 독립적으로도 뛰어난 기능을 제공하지만 함께 사용함으로써 전체적인 시스템의 성능과 효율성을 크게 향상시킬 수 있습니다.

결국, 이러한 조합은 가정에서의 IT 환경을 혁신적으로 변화시키고, 사용자가 필요로 하는 모든 것을 한 곳에서 운영할 수 있게 해줍니다. 따라서 여러분의 홈랩을 위한 필수적인 도구로 이들 소프트웨어를 고려해야 할 순간입니다.