Tools Reference

Browseagent provides 12 browser automation tools organized into 4 categories. These tools enable AI applications to fully control and interact with web browsers for a wide range of tasks.

Tool Categories

Navigation Tools
Interaction Tools
Inspection Tools
Utility Tools

Control browser navigation and page history.

Tool	Purpose	Example Use
`browser_navigate`	Navigate to a URL	”Go to github.com”
`browser_go_back`	Navigate back in history	”Go back to previous page”
`browser_go_forward`	Navigate forward in history	”Go forward one page”

Interact with page elements like clicking, typing, and hovering.

Tool	Purpose	Example Use
`browser_click`	Click elements	”Click the login button”
`browser_type`	Type text into inputs	”Enter email address”
`browser_hover`	Hover over elements	”Hover over the menu”
`browser_drag_drop`	Drag and drop elements	”Drag file to upload area”

Analyze and capture information from web pages.

Tool	Purpose	Example Use
`browser_snapshot`	Get page structure	”Show me the page layout”
`browser_screenshot`	Take page screenshots	”Screenshot this page”
`browser_get_console_logs`	Get browser console output	”Check for JavaScript errors”

Helper functions for timing and keyboard input.

Tool	Purpose	Example Use
`browser_wait`	Pause execution	”Wait 3 seconds for loading”
`browser_press_key`	Press keyboard keys	”Press Enter key”

Core Workflow Pattern

Most browser automation follows this pattern:

Navigate to the target page
Snapshot to understand page structure
Interact with specific elements using refs from snapshot
Screenshot or capture results

navigate → snapshot → interact → screenshot/results

Essential Tools for Getting Started

browser_navigate

Navigate to any website:

{
  "name": "browser_navigate",
  "arguments": {
    "url": "https://example.com"
  }
}

browser_snapshot

Get page structure and element references:

{
  "name": "browser_snapshot",
  "arguments": {}
}

Returns structured HTML with ref attributes for targeting elements.

browser_click

Click page elements using refs from snapshot:

{
  "name": "browser_click", 
  "arguments": {
    "element": "Submit button",
    "ref": "button#submit-btn"
  }
}

browser_screenshot

Capture visual results:

{
  "name": "browser_screenshot",
  "arguments": {
    "fullPage": true
  }
}

Element Reference System

Browseagent uses a reference system to reliably target page elements:

Take snapshot to get current page structure
Find target element in snapshot output
Use the ref attribute for precise targeting
Provide human description for context

Example snapshot output:

<button id="login-btn" ref="button#login-btn">Login</button>
<input type="email" ref="input[type='email']" placeholder="Email"/>

Use these refs in interaction tools:

{
  "element": "Login button", 
  "ref": "button#login-btn"
}

Common Usage Patterns

Form Automation

Navigate to page with form
Snapshot to see form structure
Type into input fields using refs
Click submit button
Screenshot results

Data Extraction

Navigate to data source page
Screenshot for visual confirmation
Snapshot to get structured data
Extract specific information from snapshot

Multi-step Workflows

Navigate to starting page
For each step:
- Snapshot current state
- Interact with elements
- Wait if needed for page changes
Screenshot final results

Error Handling

Element Not Found

If an element ref doesn’t work:

Take a new snapshot (page may have changed)
Find the updated ref for your target element
Retry the interaction

Page Loading Issues

If pages don’t load completely:

Use browser_wait to allow loading time
Take screenshot to visually verify page state
Retry snapshot once page is fully loaded

Connection Issues

If tools return connection errors:

Verify Chrome extension is connected
Check extension popup status
Restart browser or reconnect extension

Getting started

Guides

Tool Categories

Core Workflow Pattern

Essential Tools for Getting Started

browser_navigate

browser_snapshot

browser_click

browser_screenshot

Element Reference System

Common Usage Patterns

Form Automation

Data Extraction

Multi-step Workflows

Error Handling

Element Not Found

Page Loading Issues

Connection Issues

Getting started

Guides

​Tool Categories

​Core Workflow Pattern

​Essential Tools for Getting Started

​browser_navigate

​browser_snapshot

​browser_click

​browser_screenshot

​Element Reference System

​Common Usage Patterns

​Form Automation

​Data Extraction

​Multi-step Workflows

​Error Handling

​Element Not Found

​Page Loading Issues

​Connection Issues

Tool Categories

Core Workflow Pattern

Essential Tools for Getting Started

browser_navigate

browser_snapshot

browser_click

browser_screenshot

Element Reference System

Common Usage Patterns

Form Automation

Data Extraction

Multi-step Workflows

Error Handling

Element Not Found

Page Loading Issues

Connection Issues