#Natural Language Processing

50 articles with this tag

OpenAI's GPT-Live Tackles the Cocktail Party Problem

OpenAI unveils GPT-Live, a voice model that conquers the 'cocktail party problem' by understanding context and handling interruptions.

12 days ago

Artificial Intelligence

OpenAI's GPT-Live Promises Real Conversations

OpenAI unveils GPT-Live, a new voice architecture for ChatGPT that enables real-time, full-duplex conversations and seamless integration of complex AI tasks.

18 days ago

Artificial Intelligence

OpenAI's GPT-Live Achieves Natural Conversation

OpenAI's technical staff unveil GPT-Live, showcasing its ability to engage in natural, nuanced conversations, moving beyond basic text generation.

18 days ago

Artificial Intelligence

OpenAI's GPT-Live: Real-time Translation and Conversation

OpenAI introduces GPT-Live, a voice model enabling real-time language translation and conversational capabilities, bridging communication gaps.

18 days ago

Artificial Intelligence

Z.AI's GLM 5.2 Sparks Chinese Open Source AI Moment

Z.AI's GLM 5.2, a powerful open-source AI model with a 1M token context, is making waves, challenging Western AI dominance and highlighting the growing Chinese AI sector.

#Natural Language Processing

OpenAI's GPT-Live Tackles the Cocktail Party Problem

OpenAI's GPT-Live Promises Real Conversations

OpenAI's GPT-Live Achieves Natural Conversation

OpenAI's GPT-Live: Real-time Translation and Conversation

Z.AI's GLM 5.2 Sparks Chinese Open Source AI Moment

Rethinking VLM Token Reduction

LinkedIn's AI Hiring Assistant Gets Smarter

LinkedIn Hiring Assistant Goes Global

Databricks Genie Tackles Carbon Data Blind Spots

LinkedIn's AI Search Upgrade

SpatioRoute VLM: Dynamic Prompting for Video QA

AI Learns to See, Hear, and Understand

WARDEN: Tackling Low-Resource Language AI

LMPath: Semantics Supercharge UAV Search

Beyond RGB: Grounding Vision-Language on Raw Sensor Data

Databricks Genie Tackles Healthcare Readmissions

Geometric Algebra for NLP Semantics

Healthcare Data: From Months to Minutes

BioMiner: Unlocking Drug Discovery Data

Beyond Black-Box: Structuring Humor AI Reasoning

HiVLA: Decoupling Reasoning for Robotic Control

Eon AI Agent Queries Backups

Instance-Aware VLP: Beyond Global Understanding

ChatGPT Adds Voice Interaction

IBM Master Inventor Explains Multimodal AI

Personalized Driving with Vega

Externalizing Agent Harnesses with Language

Medical VLMs Fail Critical Input Sanity Checks

Perceptio: Spatial Grounding for LVLMs

3D Spatial Reasoning for VLM

AI Drills Deeper for Oilfield Insights

Descript Masters Multilingual Dubbing

Microsoft's Phi-4-reasoning-vision-15B compact AI model

CHIMERA Dataset Boosts LLM Reasoning

OpenAI's GPT-4.5 Enhances Web Search Integration

Multimodal LLMs: What's Lost in Translation?

Less Data, More Alignment: SOTAlign

NAP: Unlocking Parallel Generation in Diffusion Language Models

AI Agent for Grounded Chest X-ray Diagnosis

Multilingual LLM Guardrails Tested

Small language model optimization cracks complex business math

Ask Photos Transforms Personal Photo Discovery

Gemini Google Translate Elevates Nuance

AI Powers Railway History: A New Era for Digital Archives

Gemini Android Auto Redefines In-Car AI

Paage raises $2.2M to advance AI social commerce platform

Paage raises $2.2M to advance AI social commerce platform

Google Photos AI Features Redefine Memory Management

Solidatus raises £5M to advance AI data lineage platform

RealWear Arc 3 launch: A lighter AR headset with natural language AI for industry