0

0

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

花韻仙語

花韻仙語

发布时间:2025-12-19 08:57:17

|

444人浏览过

|

来源于php中文网

原创

在 transcription 领域,理解不同的 transcription 类型至关重要。Clean Verbatim 和 Full Verbatim 是两种常见的 transcription 方法,每种方法都有其独特的规则和应用场景。本文将深入探讨这两种 transcription 类型的区别,并提供实用的指南,帮助您在 transcription 工作中做出明智的选择。无论是新手还是经验丰富的 transcriptionist,本文都将为您提供宝贵的知识和技巧,提升您的 transcription 技能,更好地满足客户需求。 本文还将涉及 transcription 过程中需要注意的各个方面,包括 filler words 的处理、思考噪音的识别、以及如何正确使用 conjunctions。通过详细的示例和操作指南,本文旨在帮助您更好地理解 transcription 的核心原则,提高 transcription 的准确性和效率。此外,本文还会讨论作为自由职业 transcriptionist 的一些重要事项,确保您在 transcription 领域取得成功。

关键要点

Clean Verbatim transcription 旨在消除无关的语音细节,提供清晰简洁的文本。

Full Verbatim transcription 则力求捕捉每一个语音细节,包括 filler words、口头禅和重复。

Filler words 是无实际意义的词语,如 “嗯”、“啊”、“你知道” 等,在 Clean Verbatim 中通常会被省略。

思考噪音是指在说话过程中发出的非语言声音,如 “嗯哼”、“好吧”、“是的” 等,在 Clean Verbatim 中通常会被省略。

Conjunctions 的过度使用可能导致句子冗长,应根据需要进行调整,以提高文本的可读性。

识别无法辨认的词语并使用 “[Indiscernible]” 标记,确保 transcription 的完整性。

作为自由职业 transcriptionist,接受您有能力完成的 transcription 任务,并始终按时提交高质量的 transcription 结果。

Clean Verbatim vs Full Verbatim:Transcription 类型详解

Clean Verbatim:清晰简洁的 Transcription

clean verbatim transcription 是一种旨在消除无关的语音细节,提供清晰简洁的文本的 transcription 方法。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

在 Clean Verbatim transcription 中,false starts、verbal tics、stutters 以及其他与文本内容无关的语音或声音都会被省略。然而,需要注意的是,Clean Verbatim transcription 并不涉及 paraphrasing,即句子不能被改写,必须保持原文的意思。Clean Verbatim transcription 适用于需要清晰简洁文本的场景,如商务会议、讲座等。

核心特点:

  • 消除无关的语音细节
  • 保持原文意思
  • 适用于需要清晰简洁文本的场景

Full Verbatim:捕捉每一个语音细节的 Transcription

Full Verbatim transcription 是一种力求捕捉每一个语音细节的 transcription 方法。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

在 Full Verbatim transcription 中,false starts、verbal tics、stutters 以及所有utterances都会被保留。Full Verbatim transcription 适用于需要完整记录语音内容的场景,如法庭记录、研究访谈等。

核心特点:

  • 捕捉每一个语音细节
  • 完整记录语音内容
  • 适用于需要完整记录语音内容的场景

Filler Words 和 Verbal Tics:Transcription 中的干扰因素

Filler words 和 verbal tics 是指在说话过程中出现的无实际意义的词语,如 “嗯”、“啊”、“你知道” 等。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

这些词语通常用于标记 pause 或 hesitation,但在 Clean Verbatim transcription 中通常会被省略。然而,需要注意的是,不能省略那些并非作为 fillers 使用,而是对于句子的完整性至关重要的词语。例如,在句子 “What was that like for you?” 中,“like” 一词并非 filler,不能省略。正确的 transcription 应该是 “What was that like for you?”,而不是 “What was that for you?”

常见的 Filler Words:

  • 嗯 (um)
  • 啊 (uh)
  • 你知道 (you know)
  • like
  • kind of

False Starts:Transcription 中的语音中断

False start 是指 speaker 说了一句话,然后又回去更改他所说的话的情况。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

为了使 speaker 的 message 更清晰,transcriptionist 不需要包含 actual start 之前的其他内容,尤其是那些与句子无关的内容。例如,如果 speaker 说了 “I do have -- I have a question about…”,那么正确的 transcription 应该是 “I have a question about…”,而不是 “I do have -- I have a question about…”。

Transcriber实用Transcription指南

Thinking Noises:Transcription 中的非语言声音

Thinking noises 是指在说话过程中发出的非语言声音,如 “嗯哼”、“好吧”、“是的” 等。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

这些声音通常不是对 speaker 所说内容的直接反应,因此在 Clean Verbatim transcription 中通常会被省略。例如,在一段 interview 中,如果 interviewer 只是在 respondent 说话时发出 “Right” 或 “Yeah” 等声音,这些声音通常可以被省略。

区分 Thinking Noises 的关键:

  • 是否是对 speaker 所说内容的直接反应
  • 是否对理解 speaker 的 message 有帮助

示例:

错误示例:

Interviewer: How do you proceed with your inquiries?

Respondent: We try to narrow it down to --

Interviewer: Right. (thinking noise)

Respondent: -- a few questions.

Interviewer: Is the process already old, or is it still new?

Respondent: The process is still in its --

Interviewer: Yeah. (thinking noise)

Respondent: -- infancy.

正确示例:

Interviewer: How do you proceed with your inquiries?

Respondent: We try to narrow it down to a few questions.

Interviewer: Is the process already old, or is it still new?

Respondent: The process is still in its infancy。

但是,如果 “嗯哼” 是对 interviewer 问题的直接反应,则需要保留。例如:

Interviewer: You have been there, right?

Respondent: Uh-huh.

这个 “Uh-huh” 是 respondent 对 interviewer 问题的直接回答,因此不能省略。

Slang Words:Transcription 中的非正式用语

Slang words 是指在非正式场合使用的口语化词语,如 “gonna”、“wanna”、“gotta”、“alright”、“coz” 等。

Clean Verbatim vs Full Verbatim:Transcription 规则和指南

在 transcription 中,通常不建议使用 slang words,而应使用正式用语。例如,“gonna” 应改为 “going to”,“wanna” 应改为 “want to”,“gotta” 应改为 “got to”,“alright” 应改为 “all right”,“coz” 应改为 “because”。

示例:

错误示例:

I'm gonna go to the store.

Typeface
Typeface

AI创意内容创作助手

下载

正确示例:

I'm going to go to the store。

Conjunctions 的使用:避免句子冗长

Conjunctions,如 “and”,在说话中经常被过度使用,这可能导致句子冗长,影响文本的可读性。 因此,在 transcription 中,可以根据需要将长句子分成短句子,并删除不必要的 conjunctions。当然,在处理冗长的句子时,清晰度和可读性仍然是关键,

示例:

原始文本:

I painted this in Photoshop myself and it was the most spectacular vision I've ever seen in my life and I cannot forget it and it was the first time I have ever seen anything like it and my whole body went electric and when it went electric, I was in that pulsating, throbbing, vibrating state.

修改后的文本:

I painted this in Photoshop myself. It was the most spectacular vision I've ever seen in my life, and I cannot forget it. It was the first time I have ever seen anything like it. My whole body went electric. When it went electric, I was in that pulsating, throbbing, vibrating state.

无法辨认的词语:Transcription 中的未知领域

在 transcription 过程中,有时会遇到无法辨认的词语。在这种情况下,可以使用 “[Indiscernible]”、“[Inaudible]” 或 “[Unintelligible]” 等标记来表示这些词语。 这些标记可以帮助客户了解 transcription 的完整性,并知道哪些部分需要进一步澄清。

  • [Indiscernible]:用于表示无法辨认的词语
  • [Inaudible]:用于表示无法听清的词语
  • [Unintelligible]:用于表示无法理解的词语

此外,还可以添加 timestamps,以便客户可以回到 audio 的相应部分重新收听。

Speaker Tokens:Transcription 中的 speaker 识别

在 transcription 中,需要清楚地识别出 speaker。 通常情况下,可以使用 speaker 的 first name 来识别 speaker。但是,如果 speaker 的 name 无法识别,可以使用 “Interviewer” 和 “Respondent” 等标记来区分 speaker。

示例:

John: How are you doing today?

Mary: I'm doing well, thank you.

Interviewer: How are you doing today?

Respondent: I'm doing well, thank you。

其他需要注意的事项:

  • 保持 paragraphs 短小精悍,增加 whitespace,提高 transcription 的可读性。
  • 作为 freelance transcriptionist,您可以自由选择接受或拒绝 transcription 任务。
  • 只接受您有能力完成的任务,确保提供高质量的 transcription 结果。
  • 按时提交 transcription 结果,如果需要更多时间,请提前与客户沟通。

Transcription 实用技巧

准备工作

  1. 选择合适的 transcription 软件和硬件:选择一款功能强大、操作简便的 transcription 软件,并配备高质量的耳机和麦克风,以提高 transcription 的效率和准确性。

  2. 熟悉不同的 transcription 类型:了解 Clean Verbatim 和 Full Verbatim 等不同 transcription 类型的区别,并根据客户的需求选择合适的 transcription 类型。

  3. 了解 transcription 领域的专业术语:熟悉 transcription 领域的专业术语,如 filler words、thinking noises、false starts 等,以便更好地理解和处理 transcription 任务。

Transcription 过程

  1. 仔细倾听 audio:在 transcription 过程中,仔细倾听 audio,并尽可能多地了解 speaker 的语速、口音和表达方式。

  2. 准确记录语音内容:准确记录语音内容,包括 speaker 所说的每一个词语、每一个句子和每一个段落。

  3. 使用正确的 transcription 规则:根据客户的需求,使用正确的 transcription 规则,如是否需要省略 filler words、是否需要保留 thinking noises 等。

  4. 识别无法辨认的词语:在 transcription 过程中,如果遇到无法辨认的词语,可以使用 “[Indiscernible]”、“[Inaudible]” 或 “[Unintelligible]” 等标记来表示这些词语。

  5. 校对和编辑:在完成 transcription 后,仔细校对和编辑文本,确保 transcription 的准确性和可读性。

提交 Transcription 结果

  1. 按时提交:按时提交 transcription 结果,如果需要更多时间,请提前与客户沟通。

  2. 提供高质量的 transcription 结果:提供高质量的 transcription 结果,包括准确的语音内容、正确的 transcription 规则和清晰可读的文本。

  3. 与客户保持良好的沟通:与客户保持良好的沟通,及时回复客户的问题和需求。

Transcription 服务定价

影响 Transcription 服务定价的因素

Transcription 服务的定价受多种因素影响,包括 audio 的长度、难度、所需 transcription 类型、以及 transcriptionist 的经验和技能。一般来说,audio 难度越高、所需 transcription 类型越复杂、transcriptionist 的经验和技能越丰富,transcription 服务的定价就越高。

常见的定价方式:

  • 按 audio 小时数定价:这是一种常见的定价方式,通常适用于难度较低的 transcription 任务。
  • 按 transcription 字数定价:这是一种较为灵活的定价方式,适用于不同难度的 transcription 任务。
  • 按项目定价:这是一种适用于大型 transcription 任务的定价方式,通常需要与客户进行详细的沟通和协商。

如何选择合适的 Transcription 服务

在选择 transcription 服务时,需要综合考虑多种因素,包括 audio 的难度、所需 transcription 类型、预算、以及 transcriptionist 的经验和技能。建议您在选择 transcription 服务之前,先与 transcriptionist 进行详细的沟通,了解他们的经验和技能,并明确您的需求和预算。

选择合适的 transcription 服务的步骤:

  1. 明确您的需求和预算。
  2. 寻找合适的 transcriptionist。
  3. 与 transcriptionist 进行详细的沟通。
  4. 确定 transcription 服务的定价方式。
  5. 签订 transcription 服务协议。

Transcription 服务的优缺点

? Pros

节省时间和精力

提高效率

方便共享

提高可访问性

便于存储

? Cons

需要一定的成本

需要选择合适的 transcriptionist

需要与 transcriptionist 保持良好的沟通

高质量 Transcription 服务的核心特点

精准性

高质量的 transcription 服务应具备精准性,能够准确记录 audio 中的每一个词语、每一个句子和每一个段落。为了保证精准性,transcriptionist 需要具备良好的听力能力、丰富的词汇量和专业的 transcription 技能。

可靠性

高质量的 transcription 服务应具备可靠性,能够按时提交 transcription 结果,并与客户保持良好的沟通。为了保证可靠性,transcriptionist 需要具备良好的时间管理能力和沟通能力。

高性价比

高质量的 transcription 服务应具备高性价比,能够在合理的预算范围内提供高质量的 transcription 结果。为了保证高性价比,transcriptionist 需要具备丰富的经验和技能,并能够根据客户的需求选择合适的 transcription 类型和定价方式。

Transcription 服务的应用场景

商务会议

Transcription 服务可用于记录商务会议的内容,方便参会人员回顾和总结会议要点。同时,Transcription 服务还可以用于生成会议纪要,方便参会人员了解会议决议和行动计划。

讲座

Transcription 服务可用于记录讲座的内容,方便听众回顾和学习讲座知识。同时,Transcription 服务还可以用于生成讲座笔记,方便听众了解讲座要点和关键概念。

法庭记录

Transcription 服务可用于记录法庭审理的内容,为法官、律师和当事人提供准确的法庭记录。同时,Transcription 服务还可以用于生成法庭笔录,为法官、律师和当事人提供详细的法庭记录。

研究访谈

Transcription 服务可用于记录研究访谈的内容,为研究人员提供准确的访谈记录。同时,Transcription 服务还可以用于生成访谈报告,为研究人员提供详细的访谈记录。

其他

此外,Transcription 服务还可以应用于其他场景,如电话会议记录、视频会议记录、语音邮件记录、以及其他需要记录语音内容的场景。

常见问题解答

什么是 Clean Verbatim transcription?

Clean Verbatim transcription 是一种旨在消除无关的语音细节,提供清晰简洁的文本的 transcription 方法。 在 Clean Verbatim transcription 中,false starts、verbal tics、stutters 以及其他与文本内容无关的语音或声音都会被省略。然而,需要注意的是,Clean Verbatim transcription 并不涉及 paraphrasing,即句子不能被改写,必须保持原文的意思。Clean Verbatim transcription 适用于需要清晰简洁文本的场景,如商务会议、讲座等。

什么是 Full Verbatim transcription?

Full Verbatim transcription 是一种力求捕捉每一个语音细节的 transcription 方法。 在 Full Verbatim transcription 中,false starts、verbal tics、stutters 以及所有utterances都会被保留。Full Verbatim transcription 适用于需要完整记录语音内容的场景,如法庭记录、研究访谈等。

什么是 filler words?

Filler words 是指在说话过程中出现的无实际意义的词语,如 “嗯”、“啊”、“你知道” 等。 这些词语通常用于标记 pause 或 hesitation,但在 Clean Verbatim transcription 中通常会被省略。

什么是 thinking noises?

Thinking noises 是指在说话过程中发出的非语言声音,如 “嗯哼”、“好吧”、“是的” 等。 这些声音通常不是对 speaker 所说内容的直接反应,因此在 Clean Verbatim transcription 中通常会被省略。

什么是 slang words?

Slang words 是指在非正式场合使用的口语化词语,如 “gonna”、“wanna”、“gotta”、“alright”、“coz” 等。 在 transcription 中,通常不建议使用 slang words,而应使用正式用语。

相关问题

Transcription 服务有哪些优势?

Transcription 服务有很多优势,包括: 节省时间和精力:Transcription 服务可以帮助您节省时间和精力,让您专注于更重要的事情。 提高效率:Transcription 服务可以帮助您提高效率,让您更快地获取语音内容。 方便共享:Transcription 服务可以帮助您方便地共享语音内容,方便更多人了解和学习。 提高可访问性:Transcription 服务可以帮助您提高语音内容的可访问性,方便听力障碍人士了解和学习。 便于存储:Transcription 服务可以帮助您便于存储语音内容,方便您随时回顾和查看。 总之,Transcription 服务是一种非常有价值的服务,可以应用于各种场景,帮助您更好地利用语音内容。

如何选择合适的 transcriptionist?

在选择 transcriptionist 时,需要综合考虑多种因素,包括: 经验:选择具有丰富经验的 transcriptionist,他们能够更好地理解您的需求,并提供高质量的 transcription 结果。 技能:选择具备专业技能的 transcriptionist,他们能够准确记录语音内容,并使用正确的 transcription 规则。 价格:选择价格合理的 transcriptionist,在预算范围内提供高质量的 transcription 结果。 沟通:选择沟通顺畅的 transcriptionist,他们能够及时回复您的问题和需求,并与您保持良好的沟通。 口碑:选择口碑良好的 transcriptionist,他们的客户评价可以反映他们的服务质量和信誉。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
minimax入口地址汇总
minimax入口地址汇总

本专题整合了minimax相关入口合集,阅读专题下面的文章了解更多详细地址。

4

2026.03.16

C++多线程并发控制与线程安全设计实践
C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开,系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制,同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解,帮助开发者掌握构建稳定高效并发系统的关键技术。

6

2026.03.16

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

114

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

141

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

396

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

65

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

111

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

113

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

245

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 6.3万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号